第八章多计算机系统.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章多计算机系统.ppt

第八章 多计算机系统 8.1 集群计算机系统结构 8.2 典型集群系统实例 8.3 MPP系统 8.4 网格技术 8.5 网格实例 第一节 集群计算机系统结构 集群系统就是多个独立计算机的集合。 本节将从集群系统的基本概念开始,对集群系统的结构、集群系统的特点、集群间通信、集群间资源管理和任务调度以及集群间并行程序设计环境等问题分别进行介绍 1. 集群系统的基本概念和结构 集群系统由将多个高性能的工作站或高档微型计算机,使用高性能网络互连在一起,协同完成特定的并行任务. 它是一种造价低廉、易于构建且具有较好可扩放性的体系结构。集群系统中的主机和网络可以是同构的,也可以是异构的。下图为一个包含四节点的集群系统 2. 集群系统的特点 与传统并行计算机系统相比,集群系统具有许多优点: 系统开发周期短 可靠性高 可扩缩性强 性价比高 用户编程方便 集群不足之处: 由于集群由多台完整的计算机组成,它的维护相当于要同时管理多个计算机系统,因此维护工作量较大,维护费用也较高。对称多处理机则相对较好,因为管理员只要维护一个计算机系统即可。正因为如此,现在很多集群采用对称多处理机作为结点,这样可以减少结点数量,从而减少维护工作量和降低开支。 3. 集群系统的通信技术 (1)现有集群一般是使用商用以太网连接,通信协议使用的TCP/IP.集群通信具有以下缺点: 网络通信频宽低 多层结构的TCP/ICP协议处理开销大 协议复杂的缓冲管理增加了网络延迟 操作系统的额外开销 (2) 提高集群通信效率的方法 采用新型高速网络以提高网络通信频宽 目前出现了多种新型的高速网络,如共享介质型的快速以太网和基于开关型的ATM和Myrinet,极大地提高了通信频宽。 设计新的通信协议以降低通信延迟 ①在用户空间实现通信协议:直接对网络硬件设备进行必要的操作,减少通信数据的拷贝次数,提高通信效率;二是减少对操作系统调用的额外时间开销;三是用户态协议可根据用户的实际应用需求来设计,减少协议不必要的冗余。 ②精简通信协议。第一方面是功能的精简,删除不必要的功能呢,第二方面是协议层次的精简,合并协议各层的功能呢,使得通信协议变为一层,以达到减少数据传输次数的目的。 ③Active Message通信机制 Active Message是消息驱动的异步通信方式。 Active Message的通信原理如下: 消息除包含通常的数据项外,还增加了两项:消息处理程序指针Handler和参数。当消息达到目的结点时,结点处理机立即产生中断调用,由该消息的Handler启动相应的消息处理程序。消息处理程序的功能是从网卡上取出该消息并给发送方发送一个应答消息,然后返回原来被中断的程序。 Active Message通信机制有两个突出特点:一是消息驱动的异步通信方式,二是简化了对通信数据的缓冲管理。 4. 集群系统资源管理和调度 集群操作系统 是在各结点的操作系统之上再构建一层操作系统来管理整个集群,即建立一个全局UNIX,用来解决集群系统中所有资源管理,包括组调度、资源分配和并行文件系统等。这就是集群操作系统。集群操作系统须具有以下特性: 单一系统映像(Single System Image,SSI) 1.单一入口点:用户连接到集群而不是某个具体结点; 2.单一文件系统:用户看到单个目录和文件层次; 3.单一作业管理系统:用户可以透明地从任一结点提交作业,作业能在整个集群系统中透明地竞争资源。 4.单控制点:用户可以从控制工作站单点控制管理整个系统,实现系统的安装、监督和配置、系统操作、用户管理等功能。 负载均衡 负载平衡就是将各个任务均衡得分布到集群系统的各处理结点,以充分利用系统资源,提高各结点的利用率和整个系统的吞吐率。 衡量负载平衡的指标 ①吞吐率:系统上运行的应用程序的响应时间或平均完成时间。 ②可扩展性?:系统规模增大或总负载大小变化时系统负载平衡的适应能力。 ③容错性:处理机发生故障后任务恢复运行的能力。 实现负载均衡的任务调度算法 ①静态调度:在编译时根据用户程序中的各种信息(如各个任务的计算量大小、依赖关系和通信关系等)和并行系统的状况(如网络结构、各处理结点计算能力等)对用户程序中的并行任务作出静态的分配策略 ②动态调度方法:通过分析并行系统的实时负载信息,动态地将任务在各处理机之间进行分配和调度,以消除系统中负载分布的不均衡 静态调度在高度并行环境下不够均衡不准确,造成资源利用不足 动态调度会给集群带来额外的计算开销 5. 集群系统并行程序设计环境 (1)PVM(Parallel Virtual Machine,并行虚拟机) 它允许将网络上基于UNIX操作系统的并行机和单处理机的集

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档