第六章 向量处理机
|
|||||||||||||||
一、简答 |
|||||||||||||||
|
|||||||||||||||
2. 叙述向量流水处理的主要特点,它与标量流水相比有何不同之处?向量流水机的工作方式可分为哪两大类?它们的主要特点是什么? | |||||||||||||||
3.提高向量处理机性能的常用技术有那些? | |||||||||||||||
二、计算题 | |||||||||||||||
1.在CRAY1上计算Z=A*(B+C),设A、B、C都为长度为128的向量,并已经存放在相应的寄存器中,都利用浮点功能部件和链接技术,求完成该计算任务所需要的最短时间为多少拍?实际吞吐率是多少MFLOPS? | |||||||||||||||
2.一台向量计算机一次只能以下述两种方式中的一种运动:一种是向量方式,执行速度Rv为10Mflops;另一种是标量方式,执行速度Rs 为1Mflops。设a是该计算机的典型程序代码中可向量化部分的百分比 (1)导出该计算机平均执行速度Ra的公式。 (2)画出以a 为横坐标,Ra为纵坐标的曲线,a的范围为(0,1)。 (3)要使Ra达到7.5Mflops,问向量化百分比a应多大? (4)假设Rs=1Mflops,a=0.7,要使Ra达到2Mflops,问Rv应为多大? |
|||||||||||||||
3. 在CRAY1机上,按链接方式执行下面4条向量指令(括号中给出相应功能部件时间),如果向量寄存器和功能部件之间的数据传输需要1拍,试求此链接流水线的流过时间为多少拍?如果向量长度为64,则需要多少拍能得到全部结果。 V0←存储器 (存储器取数:7拍) V1←V0+V1 (向量加:3拍) V3←V2<A3 (按照A3左移:4拍) V5←V3∧V4 (向量逻辑乘:2拍) |
|||||||||||||||