单GPU及GPU异构集群的若干关键技术研究

单GPU及GPU异构集群的若干关键技术研究

作者:师大云端图书馆 时间:2015-11-19 分类:期刊论文 喜欢:3729
师大云端图书馆

【摘要】现代GPU由于其超强的计算能力、高速访存带宽、高数据级并行体系结构等特点,作为高性能运算部件在集群计算环境中得到广泛应用,并且GPU异构集群正在逐渐成为高性能计算应用领域的主流分布式计算平台,并使现代计算技术正在逐渐进入数据级并行计算的时代。数据级并行计算能否在实际应用领域得到越来越广泛的采用,不仅仅取决于所设计和实现的数据级并行算法是否能够在当前的硬件计算环境中获取较高的计算能力,更为基础和重要的是所设计和实现的数据级并行算法是否能够同时在系统层面(节点与节点之间)和节点层面(单个节点内部)具有良好的和可持续的可扩展性,即它的性能能够随着计算环境中硬件资源的计算能力和内存带宽的提升而带来几乎线性的性能提升。本文在得到多个研究课题基金资助的研究背景下,对GPU异构集群的系统层面(节点与节点之间)的可扩展性,以及节点层面(单个节点内部)的可扩展性同时展开了较为全面和深入的研究。针对系统层面算法和应用程序的可扩展性问题,本文的主要研究工作如下:(1)基于底层混合编程框架(如CUDA/MPI、OpenACC/MPI)设计并实现了一个具有应用层抽象描述能力、与体系结构具有无关性、支持持续可扩展性等特点的顶层编程框架DISPAR,为GPU异构集群在应用中所面临的核心问题提供一种系统层面有效的解决方案。(2)通过预处理器ATDCM实现DISPAR源代码到底层混合编程框架(如CUDA/MPI、OpenACC/MPI)的源代码转换,并针对底层混合编程框架提出一种能够考虑系统层面异构性的任务调度策略及相应的辅助算法以最优化系统层面的任务和GPU异构集群计算资源之间的匹配。由于更为直接的性能提升本质上来源于节点层面的应用程序,而电子设计自动化、科学计算等通用计算领域中绝大部分应用程序的性能都受限于其核心操作,如稀疏矩阵操作等。因此在节点层面针对这些核心操作,设计和实现具有可扩展性的高效数据级并行算法是能否充分利用GPU超强计算能力的关键因素。因此,本文同样针对节点层面算法和应用程序的可扩展性问题展开了较为深入的研究。主要研究工作如下:(3)GPU为了提供硬件体系结构层面的可扩展性,其所包含的成百上千个处理单元被组织和划分成多个独立的物理层面的SIMD引擎,且不同的SIMD引擎之间各处理单元之间并没有类似于单个SIMD引擎的相应同步原语。虽然可以通过原子操作提供SIMD引擎之间各处理单元之间的同步能力,但由于原子操作本质上都是串行的,从而将使得相应的并行算法不具备良好的可扩展性。本文基于可扩展性的设计理念,提出通用或特定的技术使得所设计的数据级并行算法具有良好的可扩展性。如基于桶划分预处理技术实现的奇偶合并排序和基数排序以及基于反对角线处理方式的带状矩阵向量乘操作的数据级并行算法不存在任何数据依赖,从而完全避免了同步操作和相应的原子操作,使并行算法具有良好的可扩展性。(4)由于现代GPU能够支持多个内核程序同时执行,因此对于那些即使不具有良好可扩展性的算法,也可以利用本文提出的一种有效的内核程序打包策略用于确定将哪些内核程序打包成单个内核程序能够更加充分地利用GPU的硬件资源。(5)通过对电子设计自动化领域中的时序分析这一重要应用进行可扩展性数据级并行算法的重新设计与改进,以加速电子设计自动化领域关键算法的处理速度,探索可扩展性数据级并行化技术及众核处理机技术在该领域的应用前景。本文通过对基于稀疏矩阵框架的统计静态时序分析提出一种新的稀疏格式ELLV。这种格式不仅使得相应的数据级并行算法的设计较为直接,更为重要的是使得并行算法具有良好的可扩展性。不仅如此,基于ELLV格式实现的Jacobi前条件操作与基于ELLH格式相比能够减少一半的内存访问,并最终带来15%左右的性能提升。
【作者】张珂良;
【导师】吴百锋;
【作者基本信息】复旦大学,计算机系统结构,2013,博士
【关键词】众核体系结构;图形处理器;数据级并行;并行处理;排序算法;带状矩阵向量乘操作;前条件技术;统计静态时序分析;GPU异构集群;任务调度;DISPAR顶层编程框架;

【参考文献】
[1]刘虎.单级光伏并网发电系统关键技术研究[D].兰州理工大学,电气工程,2013,硕士.
[2]王丽娜.对改革与完善我国粮食补贴政策的分析[D].吉林大学,公共管理,2004,硕士.
[3]鄢刚.川威380米~3高炉强化冶炼途径研究[D].重庆大学,冶金工程,2003,硕士.
[4]王雅.标签自动化制作软件的设计与实现[D].北京工业大学,软件工程(专业学位),2013,硕士.
[5]张灵英,陈国华.石墨烯微片对尼龙6的改性研究[J].材料导报,2011,14:85-88+92.
[6]马守荣.宏观金融运行异常的统计监测研究[D].湖南大学,应用经济学,2014,博士.
[7]李洋.列控系统车载ATP的功能安全评估技术研究与应用[D].浙江大学,检测技术与自动化装置,2013,硕士.
[8]李实.计轴自动站间闭塞的应用[J].铁道通信信号.2007(07)
[9]贾廷玉.关于IMS MDrivePlus项目本地化翻译的实践报告[D].哈尔滨工业大学,翻译,2014,硕士.
[10]落海伟,张俊,王辉,黄田.3-RPS并联机构静刚度建模方法[J].天津大学学报.
[11]崔晶晶.颅脑损伤的法医学鉴定[D].甘肃政法学院,诉讼法学,2012,硕士.
[12]常凯.我国商标平行进口问题研究[D].南京师范大学,政治经济学,2012,硕士.
[13]崔文娟.低碳经济背景下山西省出口商品结构优化研究[D].山西财经大学,国际贸易学,2013,硕士.
[14]焦方谦.彩花沟铜矿区综合异常评价方法研究及其应用[D].新疆大学,矿产普查与勘探,2013,硕士.
[15]刘蒙.协整秩检验的比较研究及其应用[D].浙江工商大学,统计学,2013,硕士.
[16]韩冷.舒尼替尼治疗进展期肾癌63例的临床研究[D].吉林大学,临床医学,2014,硕士.
[17]吴金龙.高校实验课程上机管理系统的设计与实现[D].云南大学,软件工程,2012,硕士.
[18]许世雄.轮腿式轮椅座椅位姿机构构形设计及仿真[D].河北工业大学,机械工程,2013,硕士.
[19]骆圣明.非饱和粉质粘土抗剪强度特性试验研究及其对边坡稳定性的影响分析[D].浙江工业大学,2012.
[20]张华强,王新生,王立国,REZAHadian,徐殿国.一种新颖的多电平矩阵变换器的建模与仿真[J].控制与决策,2004,10:1159-1162.
[21]张琪,黄厚宽.基于铁路客票分析的序列模式挖掘[J].铁路计算机应用,2004,07:19-21.
[22]贾春浩.基于BP神经网络的开发区土地集约利用评价研究[D].南京农业大学,土地资源管理,2011,硕士.
[23]肖培龙.重庆单轨交通轨道电路工作原理[J].铁道通信信号.2004(05)
[24]李楠.新型纳米材料修饰电极的制备及应用研究[D].西安建筑科技大学,生物化工,2013,硕士.
[25]刘新.基于GSI模型的上海城市绿地生态效应研究[D].复旦大学,环境科学,2012,硕士.
[26]路广,王永福,张伯明,周颉英,严亚勤,孙宏斌.基于UNIX/Linux的电力市场综合报表系统[J].电力系统自动化,2002,14:31-34.
[27]肖蓉.江苏省蔬菜产业的经济效益研究[D].南京农业大学,农村与区域发展,2011,硕士.
[28]张璐.师范生自身因素对教育学课课堂教学效果的影响研究[D].河北师范大学,教育经济与管理,2012,硕士.
[29]侯俊霞.转盘过滤器流场模拟及结构研究[D].北京化工大学,化工过程机械,2013,硕士.
[30]明斯(AminAsif).失败国家与干预代价[D].吉林大学,国际关系,2014,硕士.
[31]王宇.政府在处置群体性事件中的策略研究[D].吉林财经大学,行政管理学,2014,硕士.
[32]吴成浩.我国上市商业银行竞争力分析[D].山东大学,工业工程(专业学位),2012,硕士.
[33]马玉滨.K-RAS、MDM-2在大肠癌中的表达及临床意义[D].青海大学,外科学,2013,硕士.
[34]贾彬彬.有氧运动对高脂饮食大鼠血液流变学的影响[D].承德医学院,人体解剖与组织胚胎学,2011,硕士.
[35]苏勇.生态安全视角下核能开发利用的法律规制[D].西南政法大学,环境与资源保护法学,2012,硕士.
[36]王鹏.苝修饰钛氧功能材料的合成与组装[D].苏州大学,2014.
[37]邵帅.负载型Pt催化剂催化甘油氧化[D].陕西师范大学,2014.
[38]李振恩.舞台台面计算机控制系统的研究与开发[D].兰州理工大学,控制理论与控制工程,2013,硕士.
[39]崔健.斩波式串级调速系统的研究与改进[D].华北电力大学(河北),电力电子与电力传动,2004,硕士.
[40]李志勇.一个高秆显性四倍体小麦材料的发现与其DELLA蛋白丰度相关性分析[D].河南农业大学,作物遗传育种,2012,硕士.
[41]赵跃.当代展览建筑中场所营造的理论与方法研究[D].华中科技大学,建筑学,2013,硕士.
[42]牟义强.芳香二羧酸类功能晶态材料的合成、结构与性能研究[D].三峡大学,机械工程,2013,硕士.
[43]李逸文.基于Matlab的图像篡改检测算法设计与实现[D].大连理工大学,软件工程(专业学位),2012,硕士.
[44]熊时泽.国产半自动网络分析仪的研制与发展[J].宇航计测技术.1992(05)
[45]卢学毅.脉冲电沉积制备高性能核壳催化剂及其对甲酸氧化的催化作用研究[D].华南理工大学,2013.
[46]狄霖.苏北平原河网区农田养分含量分布与磷素流失规律研究[D].扬州大学,植物营养学,2011,硕士.
[47]张锦江,吴宏鑫,李季苏,邹广瑞.高精度伺服系统低速问题研究[J].自动化学报,2002,03:431-434.
[48]武春晖.G生物医药产业园项目发展模式研究[D].山东大学,项目管理(专业学位),2012,硕士.
[49]刘思.水权与治权:谁有、谁治与谁享[D].华中师范大学,政府经济学,2014,硕士.
[50]苏莎莎.Mir-10b调节K1f4介导的巨噬细胞极化并抑制T_H1T_H17细胞反应[D].南方医科大学,内科学,2014,博士.

相关推荐
更多