夹杂问题数值解法的并行实现及算法优化研究.pdfVIP

夹杂问题数值解法的并行实现及算法优化研究.pdf

  1. 1、本文档共99页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文摘要 摘 要 工程实际中,机械零部件不可避免地存在各类异质性缺陷,且缺陷通常形状各 异,分布随机,很难直接使用Eshelby 夹杂模型直接解析求解,特别对于形状不规 则的夹杂体,解析解的推导会遇到很多困难。为解决这类问题,通常将含有多个缺 陷的区域划分为一系列长方体单元,通过已有的应力场、应变场、以及位移场的解 决方案求解各个长方体单元引起的单元响应,再将所有单元结果叠加获得最终解, 此种方法被称为夹杂问题的数值解法。当需要研究的夹杂区域内具有多个夹杂体 或夹杂体形状不规则度较大时,数值解的准确性依赖于网格的细分程度,而网格的 细密化会导致计算时间的增加。过去的一段时间里,夹杂体数值解法已经利用离散 快速傅里叶卷积/相关在一定程度上提高了计算速度,但在当前对零部件性能精度 要求越来越高的趋势下,仍需探究其它方式加速数值解法的计算。 由数值算法的定义可知对应的程序中存在多个嵌套循环和独立任务分支,除 单纯的算法提升外,可考虑程序的并行化改造。随着科技不断发展,计算机中央处 理器(CPU )的核心数不断增加,图像处理器(GPU )的计算能力飞速提升,可使 用的并行编程模型越来越多,部分并行编程模型可在对程序改动不大的情况下进 行并行化改造,这些条件为程序的并行计算提供了良好的软硬件基础。本文以全空 间和半空间任意形状夹杂体数值解法为研究对象,对数值解法进行并行化改进及 算法结构优化,期望能进一步提高算法的计算效率。 本文主要内容包括三个部分: (1)数值算法中FFT 方法的选用和变换控制参数的选择。与其它夹杂问题数 值解程序中使用复数FFT 变换实数序列不同,文章使用数值算法中需要进行FFT 变换的序列,测试了离散快速傅立叶变换库FFTW 中提供的实数FFT(r2c/c2r) 同位 运算和非同位运算方法,复数FFT 同时变换双实数序列的方法进行卷积的内存占 用和时间消耗,并与复数单序列FFT 进行对比,最终确定实数FFT(r2c/c2r)非同位 运算方法的使用。同时测试了FFTW 中PLAN 在不同重复使用次数,不同序列长 度下两种变换控制参数的相对性能。 (2 )对数值算法程序实施并行化改进。使用 OpenMP 完成数值算法程序在 FORTRAN 上的四种CPU 并行模式,对不同并行模式加速下的时间消耗和内存占 用进行分析讨论,四种并行模式均明显地提高了数值算法的运行效率,其中以卷积 /相关对矩阵行和列为并行子任务的两种模式由于子任务分配不均导致核心数的浪 费,其它两种方案具有较好的负载均衡性,但在线程数较多时加速比和内存占用情 况不同。随后使用OpenACC 完成数值算法的GPU 并行加速,结果表明可获得较 I 重庆大学硕士学位论文 CPU 两倍的性能提升。 (3 )数值算法结构特性的利用和优化。分析响应原函数的计算重复性并进行 去重复优化,减少近四倍的运行时间,并在此基础上完成CPU 和GPU 并行测试, 获得了近四十倍的效率提升;独立数值算法中的激励源域和目标域网格,解决网格 独立时出现的奇点问题,使得数值算法可根据需要缩小目标域网格规模,降低计算 量,结果表明在退化为条状网格或面状网格时,计算时间相应降低为原有的四分之 一或二分之一;根据全空间响应原函数的对称特性改进算法结构,使用两种方法对 程序计算中对称的卷积结果进行数组保存,结果表明均能明显的提高全空间下的 计算效率;最后,利用响应原函数只与激励源域及目标域网格的形状和位置相关的 特性,使用二进制文件存储响应原函数序列,再次计算相同目标域网格和激励源域 网格时可直接读取响应原函数,极其明显地降低了后续的计算时间消耗。 关键词:夹杂问题;数值解;并行计算;算法优化 II 英文摘要 ABSTRACT On the scale of microns, machine components

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档