(a)
(b)
(c)
(d)
图6.3.8 行方向条带状划分的矩阵向量乘法
(a) 初始划分;(b) 多到多通信传输向量信息;
(c) 多到多通信之后的向量分布;(d) 最终结果
处理器数目p<n的情况类似,只是每个处理器存放矩阵的n/p行和向量的n/p个元素。同样也很容易理解,块带状划分与循环带状划分是没有本质区别的。算法性能的分析需要按照两种常见的网络互联结构分别讨论。
对于超立方体互联结构,n/p个向量多到多通信进行向量补齐所需要的时间量级为近似为。然后每个处理器上向量相乘的时间量级为n2/p。由此得到超立方体网络互联结构中矩阵向量乘法的时间估计:
对于2为网格结构,类似的分析可以得到其时间消耗:
列方向条带状划分与行方向类似,不再讨论。
|