(3) 几种典型系统
目前国内外许多科研机构都在对机群系统下的通信技术进行深入的研究,如UCB(University of California, Berkeley)提出的NOW计划,Cornell大学研制的U-Net系统,清华大学提出的精简通信协议RCP等,表8.4列举了在机群系统中实现的几种典型的通信子系统。
表8.4. 几种典型通信系统
系统名称
|
网络类型
|
实现技术
|
往返延迟时间( )
|
峰值带宽(Mb/s)
|
RCP(清华大学)
|
10Mbps Ethernet
|
精简通信协议
|
950 (TCP为1438)
|
8.98 (TCP为8.92)
|
RCP(清华大学)
|
640Mbps Myrinet
|
精简通信协议
|
200 (TCP为1506)
|
120 (TCP为42)
|
Fast Socket(UCB)
|
640Mbps Myrinet
|
精简通信协议
|
80
|
96
|
FM(UIUC)
|
640Mbps Myrinet
|
Active Message
|
50
|
130
|
AM(UCB)
|
640Mbps Myrinet
|
Active Message
|
31.5
|
152
|
U-Net(Cornell)
|
155Mbps ATM
|
Active Message
|
65 (TCP为1285)
|
120 (TCP为80)
|
HPAM(UCB)
|
100Mbps FDDI
|
Active Message
|
29 (TCP为2000)
|
96 (TCP为43)
|
从表中可看出,这六种系统虽然是在不同的网络硬件平台上实现的,但其性能无论是从延迟时间上看,还是从网络带宽上看,均比传统TCP/IP协议有较大幅度的提高,比如清华大学在Myrinet上实现的精简通信协议RCP通信延迟只有200微秒,比TCP的延迟时间降低了6倍,而网络带宽提高了近5倍,达到120Mb/s,这说明通信协议软件处理开销的降低对网络性能的提高有着极其重要的作用。但由于网络速度不同,性能提高的幅度会有所不同,网络速度越高,则提高性能的潜力越大。RCP分别在Ethernet和Myrinet上的延迟时间和峰值带宽数据清晰地说明了这一结论。
这些系统从实现技术上看,可分为两类,一类是采用精简通信协议的方法,另一类是使用Active Message通信机制。对比这两类系统的性能可知,采用Active
Message通信机制实现的系统的性能比用精简通信协议实现的系统一般来说要好些,例如,UCB在Myrinet上实现的Fast Socket的往返延迟时间为80微秒,而AM系统的往返延迟时间只有31.5微秒,可见,Active
Message通信机制能够更为有效地提高通信系统的性能。
高性能的工作站、高档微机的使用是提出并行机群系统的前提条件,而高速网络硬件设备的出现,则为机群系统的发展打下了坚实的基础,极大程度地推动了它的使用和推广,新型通信协议的研究又进一步发挥了高速网络的高性能,使得机群系统具有更好的性能和更广的适应性。因此可以预计,随着工作站本身性能的不断提高以及新的通信技术的研究,并行机群系统将会逐渐接近或达到MPP的性能指标,成为目前并行计算领域中的主流技术之一。