|
|
下面看看这个系统是怎样实现向量运算的。假设一个存储周期占两个处理机周期,那么图6.2的存储器系统要满足流水线所需的带宽至少应是单个存储器模块的6倍。图6.3是计算C=A+B最理想的方法。假设向量A、B、C各由八个分量组成。A[0],A[1],…,A[7]分别存放在模块0,模块1,……,模块7。B[0]存放在模块2,B[1]存放在模块3,……,B[5]存放在模块7,B[6]存放在模块0,B[7]存放在模块1。C[0]存放在模块4,C[3]存放在模块7,C[4]存放在模块0,……,C[7]存放在模块3。这样存放便于计算地址。
|