- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009系统结构B
题序 一 二 三 四 五 总分 评阅人 得分
名词解释(30分):
评分 (1)系统结构
(2)向后兼容
(3)并行性
(4)结构冲突
(5)数据冲突
(6)多功能流水线
(7)动态流水线
(8)写回法
(9)2:1Cache经验规则
(10)直接映象
(11)TLB
(12)动态网络
(13)Victim Cache
(14)链接技术
(15)分段开采
2. 在一个时钟频率f为900MHZ的处理机上执行一个标准测试程序,该程序有4种类型的指令,每种类型指令在程序中出现的条数和每种指令的CPI如下表所示: 评分 指令类型 指令条数 CPI 整数
数据传送
浮点
分支 160000
70000
40000
30000 1
2
3
4 (1)计算这个测试程序在该处理机上运行的CPI;(5分)
(2)计算这个测试程序在该处理机上的MIPS;(5分)
(3)计算这个测试程序在该处理机上的执行时间Te。(5分)
3.有一条流水线如下所示:
评分 求连续输入10条指令,该流水线的实际吞吐率;(5分)
求该流水线的最大吞吐率;(3分)
求连续输入10条指令,该流水线的效率;(5分)
该流水线的瓶颈在哪一段?如果采取重复设置部件的措施消除此“瓶颈”。请计算连续输入10条指令时,其实际吞吐率和效率。(9分)
4. 求向量D=A*(B+C),各向量元素个数均为6,参照
CRAY-1方式分解为3条向量指令: 评分 ① V3←存储器 {访存取A送入V3寄存器组}
② V2←V0+V1 {B+C→K}
③ V4←V2*V3 {K*A→D}
(注:CRAY-1方式启动访存1拍,访存6拍,打入寄存器组1拍,加法6拍,乘法7拍)
(1)当①和②并行执行完后,再执行③,需要多少拍才能得到全部结果?(5分)
(2)画出采用链接技术的链接示意图;(6分)
(3)当采用链接技术,需要多少拍才能得到全部结果?(6分)
5. Cache-主存存储层次中,主存由8个块组成(0-7)Cache为4块,现程序访存的块地址流为:0,2,0,3,0,2,7。 评分 (1) 如果Cache存储器采用全相联映象,并采用LRU替换算法。请填写表1 Cache存储器中的Cache使用过程,并标出命中时刻。(5分)
表1 全相联映象的Cache使用过程
访存块地址流 0 2 0 3 0 2 7 Cache块0 Cache块1 Cache块2 Cache块3 (2)计算以上全相联映象Cache存储器的命中率H。(3分)
(3)如果Cache存储器采用直接映象,并采用LRU替换算法。请填写表2 Cache存储器中的Cache使用过程,并标出命中时刻。(5分)
表2 直接映象的Cache使用过程
访存块地址流 0 2 0 3 0 2 7 Cache块0 Cache块1 Cache块2 Cache块3 (4) 计算以上直接映象Cache存储器的命中率H。(3分)
1.名词解释(每小题2分,共30分)
(1)系统结构——程序员所看到的计算机的属性,即概念性结构与功能特性。
(2)向后兼容——指某个时期投入市场的某种型号计算机编制的程序,不加修改就能运行于在它之后投入市场的计算机。
(3)并行性——在同一时刻或同一时间间隔内完成两种或两种以上性质相同或不同的工作。
(4)结构冲突——因硬件资源满足不了指令重叠执行的要求而发生的冲突。
(5)数据冲突——当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。
(6)多功能流水线——流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。
(7)动态流水线——同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。
(8)写回法——只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。
(9)2:1Cache经验规则——大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache的实效率。
(10)直接映象——主存中的每一块只能被放置到Cache中唯一的一个地方。
(11)TLB——一个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。
(12)动态网络——由交换开关构成,可按运行程序的要求动态地改变连接状态的网络。
(13)Victim Cache——位于Cache和存储器之间的又一级Cache,容量小,采用全相联策略。用于存放由于失效而被丢弃(替换)的那些块。每当失效发生时,在访问下一级存储器之前,先检查Victim Cache
文档评论(0)