电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > PPT文档下载
分享到微信 分享到微博 分享到QQ空间

中国科技大学并行计算课件7并行算法的一般设计过程

  • 资源ID:271412353       资源大小:826KB        全文页数:50页
  • 资源格式: PPT        下载积分:5金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要5金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

中国科技大学并行计算课件7并行算法的一般设计过程

并 行 计 算 中国科学技术大学计算机科学与技术系中国科学技术大学计算机科学与技术系国家高性能计算中心国家高性能计算中心( (合肥合肥) )20042004年年1212月月第二篇 并行算法的设计 第四章 并行算法的设计基础 第五章 并行算法的一般设计方法 第六章 并行算法的基本设计技术 第七章 并行算法的一般设计过程第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结 PCAM设计方法学设计并行算法的四个阶段 划分划分(Partitioning)(Partitioning) 通讯通讯(Communication)(Communication) 组合组合(Agglomeration)(Agglomeration) 映射映射(Mapping)(Mapping)划分:分解成小的任务,开拓并发性;分解成小的任务,开拓并发性;通讯:确定诸任务间的数据交换,监测划分的合理性;确定诸任务间的数据交换,监测划分的合理性;组合:依据任务的局部性,组合成更大的任务;依据任务的局部性,组合成更大的任务;映射:将每个任务分配到处理器上,提高算法的性能。将每个任务分配到处理器上,提高算法的性能。2022/3/294国家高性能计算中心(合肥) PCAM设计过程2022/3/295国家高性能计算中心(合肥)第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结 7.2 划分 7.2.1 方法描述 7.2.2 域分解 7.2.3 功能分解 7.2.4 划分判据 划分方法描述充分开拓算法的并发性和可扩放性;先进行数据分解(称域分解),再进行计算功能的分解(称功能分解);使数据集和计算集互不相交;划分阶段忽略处理器数目和目标机器的体系结构;能分为两类划分: 域分解域分解( (domain decompositiondomain decomposition) ) 功能分解功能分解( (functional decompositionfunctional decomposition) )2022/3/298国家高性能计算中心(合肥)7.2 划分 7.2.1 方法描述 7.2.2 域分解 7.2.3 功能分解 7.2.4 划分判据域分解 划分的对象是数据,可以是算法的输入数据、中间处理数据和输出数据;将数据分解成大致相等的小数据片;划分时考虑数据上的相应操作;如果一个任务需要别的任务中的数据,则会产生任务间的通讯;2022/3/2910国家高性能计算中心(合肥)域分解 示例:三维网格的域分解,各格点上计算都是重复的。下图是三种分解方法:2022/3/2911国家高性能计算中心(合肥)域分解 不规则区域的分解示例:2022/3/2912国家高性能计算中心(合肥)7.2 划分 7.2.1 方法描述 7.2.2 域分解 7.2.3 功能分解 7.2.4 划分判据功能分解 划分的对象是计算,将计算划分为不同的任务,其出发点不同于域分解;划分后,研究不同任务所需的数据。如果这些数据不相交的,则划分是成功的;如果数据有相当的重叠, 意味着要重新进行域分解和功能分解;功能分解是一种更深层次的分解。2022/3/2914国家高性能计算中心(合肥)功能分解 示例示例1 1:搜索树:搜索树示例示例2 2:气候模型:气候模型2022/3/2915国家高性能计算中心(合肥)7.2 划分 7.2.1 方法描述 7.2.2 域分解 7.2.3 功能分解 7.2.4 划分判据划分判据 划分是否具有灵活性?划分是否避免了冗余计算和存储?划分任务尺寸是否大致相当?任务数与问题尺寸是否成比例?功能分解是一种更深层次的分解,是否合理?2022/3/2917国家高性能计算中心(合肥)第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结 7.3 通讯 7.3.1 方法描述 7.3.2 四种通讯模式 7.3.3 通讯判据 通讯方法描述通讯是PCAM设计过程的重要阶段;划分产生的诸任务,一般不能完全独立执行,需要在任务间进行数据交流;从而产生了通讯;功能分解确定了诸任务之间的数据流;诸任务是并发执行的,通讯则限制了这种并发性;2022/3/2920国家高性能计算中心(合肥)7.3 通讯 7.3.1 方法描述 7.3.2 四种通讯模式 7.3.3 通讯判据 四种通讯模式局部/全局通讯结构化/非结构化通讯静态/动态通讯同步/异步通讯2022/3/2922国家高性能计算中心(合肥)局部通讯通讯限制在一个邻域内2022/3/2923国家高性能计算中心(合肥)全局通讯通讯非局部的例如:All to AllAll to AllMaster-WorkerMaster-Worker537212022/3/2924国家高性能计算中心(合肥)结构化通讯每个任务的通讯模式是相同的;下面是否存在一个相同通讯模式?2022/3/2925国家高性能计算中心(合肥)非结构化通讯没有一个统一的通讯模式例如:无结构化网格2022/3/2926国家高性能计算中心(合肥)7.3 通讯 7.3.1 方法描述 7.3.2 四种通讯模式 7.3.3 通讯判据通讯判据 所有任务是否执行大致相当的通讯?是否尽可能的局部通讯?通讯操作是否能并行执行?同步任务的计算能否并行执行?2022/3/2928国家高性能计算中心(合肥)第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结7.4 组合 7.4.1 方法描述 7.4.2 表面-容积效应 7.4.3 重复计算 7.4.4 组合判据方法描述 组合是由抽象到具体的过程,是将组合的任务能在一类并行机上有效的执行;合并小尺寸任务,减少任务数。如果任务数恰好等于处理器数,则也完成了映射过程;通过增加任务的粒度和重复计算,可以减少通讯成本;保持映射和扩展的灵活性,降低软件工程成本;2022/3/2931国家高性能计算中心(合肥)7.4 组合 7.4.1 方法描述 7.4.2 表面-容积效应 7.4.3 重复计算 7.4.4 组合判据表面-容积效应通讯量与任务子集的表面成正比,计算量与任务子集的体积成正比;增加重复计算有可能减少通讯量;2022/3/2933国家高性能计算中心(合肥)7.4 组合 7.4.1 方法描述 7.4.2 表面-容积效应 7.4.3 重复计算 7.4.4 组合判据重复计算重复计算减少通讯量,但增加了计算量,应保持恰当的平衡;重复计算的目标应减少算法的总运算时间;2022/3/2935国家高性能计算中心(合肥)重复计算示例:二叉树上N个处理器求N个数的全和,要求每个处理器均保持全和。 二叉树上求和,共需二叉树上求和,共需2logN2logN步步2022/3/2936国家高性能计算中心(合肥)重复计算示例:二叉树上N个处理器求N个数的全和,要求每个处理器均保持全和。 蝶式结构求和,使用了重复计算,共需蝶式结构求和,使用了重复计算,共需logNlogN步步2022/3/2937国家高性能计算中心(合肥)7.4 组合 7.4.1 方法描述 7.4.2 表面-容积效应 7.4.3 重复计算 7.4.4 组合判据组合判据 增加粒度是否减少了通讯成本?重复计算是否已权衡了其得益?是否保持了灵活性和可扩放性?组合的任务数是否与问题尺寸成比例?是否保持了类似的计算和通讯?有没有减少并行执行的机会?2022/3/2939国家高性能计算中心(合肥)第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结7.5 映射 7.5.1 方法描述 7.5.2 负载平衡算法 7.5.3 任务调度算法 7.5.4 映射判据方法描述 每个任务要映射到具体的处理器,定位到运行机器上;任务数大于处理器数时,存在负载平衡和任务调度问题;映射的目标:减少算法的执行时间并发的任务并发的任务 不同的处理器不同的处理器任务之间存在高通讯的任务之间存在高通讯的 同一处理器同一处理器映射实际是一种权衡,属于NP完全问题;2022/3/2942国家高性能计算中心(合肥)7.5 映射 7.5.1 方法描述 7.5.2 负载平衡算法 7.5.3 任务调度算法 7.5.4 映射判据负载平衡算法 静态的:事先确定;事先确定;概率的:随机确定;随机确定;动态的:执行期间动态负载;执行期间动态负载;基于域分解的:递归对剖递归对剖局部算法局部算法概率方法概率方法循环映射循环映射2022/3/2944国家高性能计算中心(合肥)7.5 映射 7.5.1 方法描述 7.5.2 负载平衡算法 7.5.3 任务调度算法 7.5.4 映射判据任务调度算法 任务放在集中的或分散的任务池中,使用任务调度算法将池中的任务分配给特定的处理器。下面是两种常用调度模式:经理/雇员模式非集中模式2022/3/2946国家高性能计算中心(合肥)7.5 映射 7.5.1 方法描述 7.5.2 负载平衡算法 7.5.3 任务调度算法 7.5.4 映射判据映射判据 采用集中式负载平衡方案,是否存在通讯瓶颈?采用动态负载平衡方案,调度策略的成本如何?2022/3/2948国家高性能计算中心(合肥)第七章 并行算法的一般设计过程 7.1 PCAM设计方法学 7.2 划分 7.3 通讯 7.4 组合 7.5 映射 7.6 小结小 结 划分域分解和功能分解域分解和功能分解通讯任务间的数据交换任务间的数据交换组合任务的合并使得算法更有效任务的合并使得算法更有效映射将任务分配到处理器,并保持负载平衡将任务分配到处理器,并保持负载平衡2022/3/2950国家高性能计算中心(合肥)

注意事项

本文(中国科技大学并行计算课件7并行算法的一般设计过程)为本站会员(东***)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.