《低成本高性能计算的实现与测试》.ppt

《低成本高性能计算的实现与测试》.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
低成本高性能计算的实现与测试 昆明理工大学 云南省计算机技术应用重点实验室 谭伟良 2008-11-27 实验室介绍 昆明理工大学云南省计算机技术应用重点实验室是云南省在信息技术方向唯一的一所省级重点实验室。目前拥有教授级研究人员19人,中职21人,普通计算机人员80多名。多年来,在社会各界的大力支持下,云南省计算机技术应用重点实验室在承担、完成科研项目方面及实验室的开放运行、队伍建设、培养人才、实验室管理等方面,都取得了不少成绩,其科研的规模和水平均已具备较强的实力。 研究所拥有一个由21台曙光服务器构成的理论峰值每秒超过1万亿次浮点运算能力的高性能计算集群,2台Sun的小型机,4台Sun服务器,4台Dell的服务器,6台HP服务器,7台IBM服务器,台机40台,笔记本15台,拥有四个网络出口:校园网1G,网通150M,电信150M,联通150M。 概要 相关介绍 环境搭建 性能测试 心得体会 相关介绍 目前,HPC的应用范围越来越广,除了一些特殊的应用需要高性能计算外,一些如:数据挖掘应用、图像处理业务、基因测序比对处理等领域也越来越需要高性能计算。 科学计算领域 更快的速度 更高的精度 更大的范围 信息服务领域 更好地整合、提高可管理性 更高的吞吐率 更高的可靠性 面临的问题 但是,想要得到一个高性能解决方案,往往意味着要投入大量的金钱。 国内: 曙光4000A(10万亿次运算能力),市场价格约为1亿人民币。 曙光5000A (200万亿次运算能力),市场价格约为2亿人民币。 国外能达到相同计算规模的超级计算机,价格大约是国内的5~6倍。 一个小规模的高性能解决方案,也需要花上百万乃至上千万的成本投入。 低成本高性能计算的产生 一方面是有限的成本投入,一方面是对高性能计算的迫切需要。怎样在这两者之间取得一个平衡点? 因此,构建一个低成本、高性能的解决方案由此产生。 多种结构的比较 环境搭建 硬件环境搭建 软件环境搭建 低成本考虑: 1)从硬件上降低成本 2)从软件上降低成本 3)从日常维护费用上降低成本 高性能考虑: 1)使用高频、多核CPU 2)使用优化的数学库 3)优化网络环境 硬件环境搭建 硬件选购: 1)计算节点: 对大量集群环境配置的经验性研究显示小型SMP平台最适合构建HPC集群,并且现在的多核技术已经达到平民化的程度,因此使用多路处理器的节点成为首选。 选用AMD处理器 在很多领域中,需要对大量的数据进行处理。 这种模式对每个节点上的性能及I/O吞吐量提出了很高要求。AMD皓龙处理器的直连架构和超传输总线(HyperTransport)技术,保证了低内存延时和缓存的一致性,避免了系统扩展带来的性能瓶颈,可实现处理器核心之间的高速数据交换,提升节点性能,满足了应用的需求。以及其相对低廉的价格,是搭建一个低成本解决方案的重要因素。(更适合多核单节点的情况) 2)网络 一般在大中型集群中,往往会使用InfiniBand,Myrinet等高速网络。但是他们的价格都不菲,针对于小型的集群搭建,使用千兆网络已经能够满足小型集群的网络通讯的需要。 网络比较 硬件材料清单 21台曙光A620r-F服务器 每台服务器的主要参数: 2个AMD Opteron 2352 2.1G CPU 4G内存 250G SATA2硬盘 600W 2U单电源 曙光A系列双路主板 一台华为千兆交换机 若干千兆网线 与同配置的其它服务器对比 与HP、SUN的服务器相比,使用曙光服务器更具有价格优势。 比曙光服务器高至少一倍的价格。 网络拓扑 实际运行中的机器 软件环境基本搭建 (尽可能使用开源软件) 考虑因素 考虑到成本与实际环境的因素,我们使用开源软件对我们这个集群进行管理和相关的应用。 因为开源软件自身的局限性,不可能提供很好的集群管理机制。因此在较大规模集群方案中,如果还是使用开源的软件去对集群进行管理,日常的维护工作量就会明显增多。(建议使用专门的集群管理软件:CSM(Linux)、 SUN Cluster 3.0、 DCMM系统监控DCMS集群管理 ) 软件 系统配置有标准的C、C++、Fortran和Java等主流编译器,将来还要在这基础上安装其它的并行编程环境,如PVM、HPF、OpenMP、串行程序自动并行化工具、并行调试器、并行程序监控工具和并行数学库函数。还可以安装一些针对与某些领域的应用软件,如Accelrys Material Studio材料计算软件等。 开发模式 支持串行程序、消息传递程序、SMP多线程程序、HPF数据并行程序、分布式共享虚存等多种编程模型。 根

文档评论(0)

nnnn1 + 关注
实名认证
内容提供者

没有什么可以说的了

版权声明书
用户编号:5042300334000003

1亿VIP精品文档

相关文档