6.3.3.1 行方向条带状划分
从最极端的情况入手:p=n,见图6.3.8。最初每个处理器存储矩阵的一行以及向量的一个元素。由于矩阵与向量相乘需要用到整个向量,所以每个处理器都要把自己所存储的向量元素发送给其它处理器,这是一个多到多的通信过程。向量分布到各个处理器上后就可以进行乘法运算了。