条带状划分的矩阵转置可以参照图6.3.3来完成,其算法描述和性能分析留作作业,由读者完成。


图6.3.3 4个处理器上的4×4矩阵转置