基于GPU的不可压缩管流并行数值模拟关键技术研究

基于GPU的不可压缩管流并行数值模拟关键技术研究

作者:师大云端图书馆 时间:2021-06-30 分类:硕士论文 喜欢:2080
师大云端图书馆

【摘要】不可压缩管流问题作为流体力学的重要研究对象,对此进行的研究成果被广泛应用于等离子体物理学和磁流体力学等相关领域的科学研究。对不可压缩管流进行精确模型的数值模拟需要巨大的计算资源和时间代价,始终是研究难点和热点。本文通过研究其中的两个关键步骤稀疏矩阵向量乘与有限差分Stencil算法,结合并行优化技术和数据局部性优化技术提高了不可压缩管流数值模拟的运行效率。在不可压缩管流数值模拟的矩阵向量乘求解问题中,矩阵一般呈现出总体稀疏局部存在较多稠密子矩阵的特征。传统稀疏矩阵存储结构并不能很好地利用这一特征,因此本文提出了QCSR稀疏矩阵存储结构。QCSR存储结构结合了四叉树结构和CSR存储结构的优势,通过对稀疏矩阵进行递归式分解和重排列实现矩阵的存储,提高矩阵向量乘运算的数据局部性。本文接着分析了CPU-GPU异构并行系统的编程模型CUDA,通过采用线程映射优化、数据存取优化、数据传输优化和数据复用优化四个策略,在GPU上实现了基于QCSR存储结构的稀疏矩阵向量乘。实验表明,与CSR存储格式对比,基于QCSR存储结构的稀疏矩阵向量乘取得了平均1.15的加速比,并且降低了运算过程中矩阵内非零元素分布因素对运算的影响,更具有普适性。因不可压缩管流中管流和外加磁场之间的相互作用以及传热问题的复杂性,基于压力与速度场耦合方程组的半隐式方法需采用细粒度的网格划分方式来分析流体内部细节,并由有限差分Stencil算法求解方程组。针对基于单向区域划分方法的有限差分Stencil算法会出现迭代间数据局部性差和可扩展性差等问题,本文提出了基于多网格空间对称交错条块式的有限差分Stencil并行迭代算法。该算法通过采用基于网格交错条块的区域划分策略,引入时滞技术并沿新增的时间轴方向将迭代空间划分成交错条块,提高了条块内部的数据局部性;通过采用多网格对称运行策略,提高算法并行度,加快了有限差分Stencil迭代算法的收敛速度;通过采用交错条块的重排序策略,有效地减少有限差分Stencil算法在迭代过程中的通信和同步开销,提高了并行效果。本文进一步在GPU上实现了多维有限差分Stencil迭代算法。实验表明,采用相应优化策略后的有限差分Stencil迭代算法性能缩短了计算时间。本文通过使用并行优化技术和CPU-GPU异构并行系统优化了稀疏矩阵向量乘和有限差分Stencil迭代算法这两个关键计算步骤,提升了不可压缩管流数值模拟效率。对此进行的并行化研究成果具有一般性,可以推广到相关的数值计算领域中。
【作者】刘恩益;
【导师】万健;
【作者基本信息】杭州电子科技大学,计算机软件与理论,2014,硕士
【关键词】稀疏矩阵向量乘;有限差分算法;并行计算;对称交错条块;

【参考文献】
[1]尤佳.CryⅢA基因植物表达载体构建及马铃薯遗传转化[D].甘肃农业大学,植物学,2013,硕士.
[2]张媛媛.90年代女性成长小说分析[D].黑龙江大学,亚非语言文学,2013,硕士.
[3]陈瑶.参照群体作用下大学生网络团购感知对购买意愿的影响[D].南京航空航天大学,企业管理,2013,硕士.
[4]方妹.我国律师协会自治研究[D].安徽大学,法学理论,2014,硕士.
[5]马双双.资金有限销售商的库存决策及其优化研究[D].河南农业大学,企业管理,2012,硕士.
[6]张大海.少数民族预科学生的学习态度及其对英语学习的影响研究[D].西南大学,英语语言文学,2012,硕士.
[7]崔晓聪.结构方程模型参数估计方法改进研究[D].大连理工大学,系统分析与集成,2013,硕士.
[8]王健新.我国侦查机关适用非法证据排除规则的困境与出路[D].华侨大学,法律,2013,硕士.
[9]宋楠.RFID技术与电磁兼容性分析[D].天津大学,电子与通信工程,2013,硕士.
[10]曾莉莉.江苏省丹阳市城镇妇女体育活动现状调查与分析[D].扬州大学,体育教育训练学,2012,硕士.
[11]马宁宁.基于分布式流体网络的电力系统机电扰动传播研究[D].西南交通大学,电气工程,2013,硕士.
[12]张科.大样本手背静脉特征及分类器设计研究[D].北方工业大学,信号与信息处理,2014,硕士.
[13]李进华.腺病毒感染对CSE腹腔注射肺气肿小鼠肺部炎症及凋亡的影响[D].中南大学,临床医学,2014,博士.
[14]王婧.民事诉讼行为保全制度研究[D].内蒙古大学,法律,2013,硕士.
[15]魏忠斌.提升小波有限元的单元构造研究[D].西安建筑科技大学,机械电子工程,2013,硕士.
[16]庾志成.全球手机电视技术及业务进展分析[J].现代电信科技.2006(06)
[17]王卫英.名词的借代义及其在语文词典中的释义研究[D].河北师范大学,汉语言文字学,2012,硕士.
[18]刘伟东.钢铁厂烧结料水分控制的仿真研究[D].北方工业大学,检测技术与自动化装置,2013,硕士.
[19]王兰.铅锌矿采选项目环境监理研究[D].兰州大学,环境工程,2013,硕士.
[20]李鹏飞.基于数据仓库、数据挖掘技术的电子政务建设[J].现代电子技术,2004,04:1-3.
[21]王玉宁.变通策略在《失聪之刑》翻译中的运用[D].复旦大学,翻译,2012,硕士.
[22]罗明.湖南清代文教建筑研究[D].湖南大学,建筑设计及其理论,2014,博士.
[23]孟令松.环氧沥青同步洒布摊铺机液压系统设计及行走系统研究[D].燕山大学,流体机械及工程,2014,硕士.
[24]林靖博.通用型自动变速箱总成测试系统的设计与实现[D].烟台大学,电子与通信工程,2014,硕士.
[25]刘淳鋆.商业方法专利保护问题研究[D].黑龙江大学,法律,2013,硕士.
[26]杨远.苏童小说的叙事伦理研究[D].上海大学,文艺学,2013,硕士.
[27]赵怿甦.数据挖掘在农业环境中的应用[D].天津大学,2004.
[28]吴陈璐.内源性载脂蛋白O对脂肪细胞分泌功能的影响及机制初探[D].中南大学,临床医学,2014,博士.
[29]白玉.新疆果品网络营销研究[D].新疆大学,企业管理,2013,硕士.
[30]李盼,张锦.单壁碳纳米管的结构控制生长方法[J].化学进展,2013,Z1:167-178.
[31]雅兰.俄罗斯布里亚特国立大学孔子学院现状调查与分析[D].山东师范大学,汉语国际教育(专业学位),2013,硕士.
[32]朱世一.小型发动机台架试验测控系统的研制[D].南京理工大学,车辆工程,2013,硕士.
[33]霍晓敏.场景知觉中视觉搜索过程的性别差异[D].宁夏大学,应用心理学,2014,硕士.
[34]马聪.基于PPP模式的北京市郊轨道交通投融资模式研究[D].北京交通大学,2012.
[35]NguyenTienThanh.区域地球化学元素空间分布模式研究[D].中国地质大学,地图制图学与地理信息工程,2014,博士.
[36]解江凌,刘延平,赵杨.企业社会责任报告质量评估指标体系研究——基于国内外主流评估体系[J].生产力研究,2014,07:86-90.
[37]孙欣,夏清.基于交易空间的可用传输容量计算方法[J].电力系统自动化,2009,10:11-15.
[38]赵凡.基于支持向量机的ABS树脂聚合温度控制研究[D].大连理工大学,2004.
[39]陈乡寿.滇西红层软岩地区特高路堤稳定性研究[D].重庆交通大学,道路与铁道工程,2012,硕士.
[40]陈久权.土钉墙在基坑支护工程中的应用研究[D].燕山大学,工程力学,2012,硕士.
[41]李淼.大连市重点初中体育教育现状与对策研究[D].辽宁师范大学,体育教育训练学,2011,硕士.
[42]马姬智.洛阳中信银行个人理财业务拓展研究[D].河南科技大学,工商管理(专业学位),2013,硕士.
[43]程晓桐.近圆轨道含饱和函数推力的两航天器追逃策略及数值求解[D].哈尔滨工业大学,固体力学,2014,硕士.
[44]车松霖.西安市物流业技术进步的测算及其影响因素的分析[D].西安工程大学,企业管理,2012,硕士.
[45]白惠萍.γ-氨基丁酸B型受体对糖尿病神经痛合并抑郁大鼠海马脑源性神经生长因子表达的影响[D].河北医科大学,麻醉学(专业学位),2014,硕士.
[46]刘海军.大豆蛋白致仔猪肠道过敏反应作用及检测技术研究[D].南京农业大学,动物营养与饲料科学,2011,硕士.
[47]曹磊.施肥对城市园林用银杏断根后生长和根系恢复的作用[D].河北农业大学,2005.
[48]贾银兰.大学生网络情绪宣泄分析与引导研究[D].华中师范大学,思想政治教育,2013,硕士.
[49]孙中刚.刨煤机动力学仿真及可靠性研究[D].辽宁工程技术大学,机械制造及其自动化,2012,硕士.
[50]张行.钢结构住宅框架半刚性节点分析研究[D].武汉理工大学,结构工程,2003,硕士.

相关推荐
更多