基于openMP的并行计算实验.doc

资源ID：14153 资源大小：89KB 全文页数：9页
资源格式： DOC 下载积分：10金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要10金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

基于openMP的并行计算实验.doc

-并行计算实验报告课程：并行计算实验一：OpenMP根本使用一、实验目的1、熟悉OpenMP编程。2、比拟串行算法与并行算法在执行时间上的差异；3、考察线程数目使用不同对并行算法执行时间的影响；4、考察运算规模N对串、并行算法执行时间上的影响。二、实验容1、使用OpenMP进展两个矩阵A和B的加法，并分析串行、并行时间的差异以及问题规模对程序运行时间的影响三、实验步骤1、整个程序的设计流程全局变量设置三个宏定义过的size×size的二维数组啊a,b,c。初始化a数组为全1，b数组为全2通过omp_set_num_threads()库函数设置线程数调用openMP库函数omp_get_wtime()获取当前时间start #pragma omp parallel for开场做并行区局部完毕后再次调用omp_get_wtime()获取时间end，end-start即为并行消耗时间再次调用时间函数更新strat串行做一边矩阵相加更新end,end-start即为串行耗时代码如下：#include<iostream>#include<omp.h>#define size 10000using namespace std;intasizesize,bsizesize,csizesize;int main() for(int i=0;i!=size;+i) /initial the matrixfor(int j=0;j!=size;+j) aij=1;bij=2;double start=omp_get_wtime();omp_set_num_threads(4);#pragma omp parallel forfor(int i=0;i<size;+i)for(int j=0;j<size;+j)cij=aij+bij;double end=omp_get_wtime(); cout<<"并行运行时间："<<end-start<<endl;start=omp_get_wtime();for(int i=0;i<size;+i)for(int j=0;j<size;+j)cij=aij+bij;end=omp_get_wtime();cout<<"串行运行时间："<<end-start<<endl;system("pause");2、问题规模对串、并行程序时间的影响(A、B矩阵的大小为N*M)(1)通过不断增加问题规模，观察串行和并行程序的执行时间，得到如下表格的时间消耗数据：100*1001000*100010000*10000串行消耗(ms)0.034.36296.91并行消耗(ms)7.069.54182.27(2)可以发现，当矩阵规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。并行算法对各个CPU的调度也占用一定的时间，当问题规模很小的时候，这个调度时间占了很大的比重，而在规模较大的时候，这个调度时间就显得微乎其微了3、线程数目对并行程序的影响这里假设问题规模为：N*M=10000*10000(1)在使用OpenMP进展并行执行矩阵加法时，我们可以自由设置进展并行计算的并行线程数目。(2)在并行区域中，通过函数int omp_set_num_threads(int)设置并行区域中要创立的线程数，分别设置为2、4、8、16，得到如下表格的时间消耗24816并行消耗(ms)262.73205.12248.97295.38(3)观察发现，在问题规模不变的前提下，随着线程数目的增加，问题解决的时间也在相应的减少。但是，问题消耗的时间并不会随着线程数目的增加而不断的减少，原因可能是因为，随着线程数目的增减，线程的额外准备时间开销也将扩大。四、心得体会通过本次实验，了解了openMP库函数，掌握了openMP最根本的多线程程序编写。通过分析比拟串并行运行时间，体会了不同规模下串并行的使用效果。实验二：使用OpenMP实现圆周率计算的并行算法一、实验目的1、考察问题规模N对圆周率计算准确度的影响；2、考察线程数目对圆周率计算执行时间的影响；3、比拟串、并行算法在执行时间上的差异。二、实验容1、使用OpenMP和近似计算公式计算圆周率的大小，并分析串行、并行时间的差异以及问题规模对程序运行时间的影响三、实验步骤1、整个程序的设计流程全局变量设置宏size，用来描述计算围利用如下公式准备计算圆周率的近似值通过omp_set_num_threads()库函数设置线程数调用openMP库函数omp_get_wtime()获取当前时间start#pragmaomp parallel forreduction(+:sum)开场做并行区局部注意：其中sum是共享的，因为是个连续和的问题，采用reduction之后，每个线程根据reduction+: sum的声明算出自己的sum，然后再将每个线程的sum加起来。防止各个线程共享sum资源时出现问题完毕后再次调用omp_get_wtime()获取时间end，end-start即为并行消耗时间再次调用时间函数更新strat串行做一边矩阵相加更新end,end-start即为串行耗时代码如下：#include<iostream>#include<omp.h>#definesize10000000usingnamespacestd;intmain()doublesum=0,start,end;omp_set_num_threads(4);start=omp_get_wtime();#pragmaomp parallel forreduction(+:sum)for(inti=0;i<size;+i)sum+=4/(1+(0.5+i)/size)*(0.5+i)/size)*1/size;end=omp_get_wtime();cout<<"并行时间:"<<end-start<<endl;sum=0;start=omp_get_wtime();for(inti=0;i<size;+i)sum+=4/(1+(0.5+i)/size)*(0.5+i)/size)*1/size;end=omp_get_wtime();cout<<"串行时间:"<<end-start<<endl;cout.precision(20);cout<<"："<<sum<<endl;system("pause");2、问题规模对串、并行程序时间的影响(N的大小影响时间)(1)通过不断增加问题规模，观察串行和并行程序的执行时间，得到如下表格的时间消耗数据：100010000010000000串行消耗(ms)0.044.10365.70并行消耗(ms)4.6015.04188.48(2)可以发现，当规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。并行算法对各个CPU的调度也占用一定的时间，当问题规模很小的时候，这个调度时间占了很大的比重，而在规模较大的时候，这个调度时间就显得微乎其微了3、线程数目对并行程序的影响这里假设问题规模为：N=100000(1)在使用OpenMP进展并行执行运算时，我们可以自由设置进展并行计算的并行线程数目。(2)在并行区域中，通过函数int omp_set_num_threads(int)设置并行区域中要创立的线程数，分别设置为2、4、8、16，得到如下表格的时间消耗24816并行消耗(ms)3.263.233.1430.9(3)观察发现，在问题规模不变的前提下，随着线程数目的增加，问题解决的时间也在相应的减少。但是，问题消耗的时间并不会随着线程数目的增加而不断的减少，原因可能是因为，随着线程数目的增减，线程的额外准备时间开销也将扩大。四、心得体会通过本次实验，进一步深入了openMP的编程，对openMP各线程共享资源、各自拥有自己的资源有了初步认识。再一次体会到了并行计算给大规模计算带来的便利性。实验三：使用OpenMP求最大值一、实验目的1、掌握求最大值的并行算法2、比拟串行算法与并行算法在执行时间上的差异；3、考察线程数目使用不同对并行算法执行时间的影响；二、实验容1、使用OpenMP求一个乱序数列的最大值，并分析串行、并行时间的差异以及问题规模对程序运行时间的影响三、实验步骤1、整个程序的设计流程本程序实现了平衡树算法，但由于处理器数目有限，并行结果反而不如串行，不过当处理器足够多时理想情况为数组长度的一半时，并行会有大的提升。这里只讲一下平衡树算法思路。全局变量设置num×size的二维数组，最后一维用来保存数列其中：num=log(size-1)/log(2)+1;表示平衡树的高度初始化最后一维数组通过omp_set_num_threads()库函数设置线程数调用openMP库函数omp_get_wtime()获取当前时间start #pragma omp parallel for开场做并行区局部完毕后再次调用omp_get_wtime()获取时间end，end-start即为并行消耗时间算法核心局部：算法先处理最后一层平衡树(假设个数为n)，两个数据一组比拟，取大的，生成新的一层平衡树(个数为n/2或者(n+1)/2),放在二维数组的上一维。迭代处理每一层，最后使得新的一层个数为1，这个值就是最大值，即a11;并行处理每一层平衡树代码如下：#include<iostream>#include<math.h>#include<omp.h>const int size=10000;using namespace std;int asize+1size+1;int main()int num=log(size-1)/log(2)+1;for(size_t i=1;i<=size;+i) /初始化anumi=i;int m=0;double start=omp_get_wtime();for(size_t i=1;i<=size;+i) /串行if(anumi>=m)m=anumi;double end=omp_get_wtime();cout<<"串行:"<<end-start<<endl;int amax=size;omp_set_num_threads(4);start=omp_get_wtime();for(int k=num-1;k>=0;k-)#pragma omp parallel forfor(int j=1;j<=(amax-1)/2+1;j+) if(2*j>amax)akj=ak+1amax;elseakj=ak+12*j-1>ak+12*j"ak+12*j-1:ak+12*j; end=omp_get_wtime();cout<<"并行:"<<end-start<<endl;system("pause");2、问题规模对串、并行程序时间的影响(数列长度为N)(1)通过不断增加问题规模，观察串行和并行程序的执行时间，得到如下表格的时间消耗数据：N100100010000串行消耗(ms)1.23e-61.35e-53.4e-5并行消耗(ms)0.00310.03600.047(2)可以发现，并行总是比串行慢。主要原因是：平衡树算法对处理器个数有很高的要求，在处理器个数到达问题规模的一半的时候才有最好的效果，本机只有4个线程，线程的调度反而使得整个时间消耗比串行多。3、线程数目对并行程序的影响这里假设问题规模为：N*M=10000*10000(1)在使用OpenMP进展并行执行矩阵加法时，我们可以自由设置进展并行计算的并行线程数目。(2)在并行区域中，通过函数int omp_set_num_threads(int)设置并行区域中要创立的线程数，分别设置为2、4、8、16，得到如下表格的时间消耗24816并行消耗(ms)0.0060.0040.040.06(3)观察发现，在问题规模不变的前提下，随着线程数目的增加，问题解决的时间也在相应的减少。但是，问题消耗的时间并不会随着线程数目的增加而不断的减少，原因可能是因为，随着线程数目的增减，线程的额外准备时间开销也将扩大。四、心得体会通过本次实验，学会了平衡树的算法设计思想，见识到了高性能计算在庞大任务规模面前的解决问题的能力。在实验的过程中使用平衡树没有得到理想的结果，也说明了高性能计算在处理器方面的限制。实验四：使用OpenMP计算矩阵相乘一、实验目的1、掌握矩阵的乘法的串、并行算法2、比拟串行算法与并行算法在执行时间上的差异；3、考察线程数目使用不同对并行算法执行时间的影响；二、实验容1、给定两个矩阵AN,M1和BM1,M的乘积，即求CN,M=AN,M1*BM1,M。三、实验步骤1、整个程序的设计流程计算矩阵的乘法，简单的使用三重循环完成，并行对最外层循环并行计算全局变量设置3个数组：aM+1N+1,bN+1M+1,cM+1M+1初始化三个数组通过omp_set_num_threads()库函数设置线程数调用openMP库函数omp_get_wtime()获取当前时间start #pragma omp parallel for开场做并行区局部完毕后再次调用omp_get_wtime()获取时间end，end-start即为并行消耗时间代码如下：#include<iostream>#include<omp.h>#defineM500#defineN500usingnamespacestd;intaM+1N+1,bN+1M+1,cM+1M+1;intmain()/init arrayfor(inti=1;i<=M;i+)for(intj=1;j<=N;j+)aij=1;for(inti=1;i<=N;i+)for(intj=1;j<=M;j+)bij=2;/parallel doomp_set_num_threads(4);doublestart=omp_get_wtime();#pragmaomp parallel forfor(inti=1;i<=M;i+)for(intj=1;j<=M;j+)for(intk=1;k<=N;k+)cij+=aik*bkj;doubleend=omp_get_wtime();cout<<"并行:"<<end-start<<endl;/serial dostart=omp_get_wtime();for(inti=1;i<=M;i+)for(intj=1;j<=M;j+)for(intk=1;k<=N;k+)cij+=aik*bkj;end=omp_get_wtime();cout<<"串行:"<<end-start<<endl;system("pause");2、问题规模对串、并行程序时间的影响(二维数组为N*N)(1)通过不断增加问题规模，观察串行和并行程序的执行时间，得到如下表格的时间消耗数据：N10030010000串行消耗(ms)0.00720.1190.49并行消耗(ms)0.01980.1000.31(2)可以发现，当规模较小时，串行算法仍然要比并行算法运行的快，当规模到达一定程度的时候，并行运行的速度较串行有了提升。并行算法对各个CPU的调度也占用一定的时间，当问题规模很小的时候，这个调度时间占了很大的比重，而在规模较大的时候，这个调度时间就显得微乎其微了3、线程数目对并行程序的影响这里假设问题规模为：N*M=500*500(1)在使用OpenMP进展并行执行矩阵加法时，我们可以自由设置进展并行计算的并行线程数目。(2)在并行区域中，通过函数int omp_set_num_threads(int)设置并行区域中要创立的线程数，分别设置为2、4、8、16，得到如下表格的时间消耗24816并行消耗(ms)0.4180.2540.2520.352(3)观察发现，在问题规模不变的前提下，随着线程数目的增加，问题解决的时间也在相应的减少。但是，问题消耗的时间并不会随着线程数目的增加而不断的减少，原因可能是因为，随着线程数目的增减，线程的额外准备时间开销也将扩大。四、心得体会挺水的一次实验，不是因为实验水，而是感觉跟第一次实验没什么区别，线程只是利用线程数去减少了时间开销，而不是降低了问题的复杂度。主要是矩阵的乘法，自己没有用到好的算法。不过目前计算矩阵的乘法还没有找到O(n2)或者比O(n2)时间复杂度更小的算法吧. z.

注意事项

本文（基于openMP的并行计算实验.doc）为本站会员（夺命阿水）主动上传，课桌文档仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知课桌文档（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。