|
Tesla-CUDA高性能计算行业应用案例
复杂多相流动分子动力学模拟在GPU上的实现
Tesla高性能计算应用案例-MATLAB、生命科学和医疗成像
GPU加速Matlab高性能计算-Tesla+Jacket Engine解决方案
现在,科卓Quadro系列高性能计算工作站的新品发布了,它采用了Intel代号为Nehalem-EP的Xeon 5500最新平台。
科卓Quadro 8120-TC高性能计算工作站

HP Z800工作站 + NVIDIA Tesla C1060
|
科卓Quadro 8120-TC I/II 产品规格(标配) |
|
主机 |
惠普HP Z800工作站 |
|
芯片组 |
双Intel 5520 |
|
CPU |
2×Intel Xeon X5550 2.66GHz 8MB 6.4GT/s |
|
内存 |
6GB (6x1GB) / 12GB (6x2GB) DDR3-1333 ECC 6通道 |
|
硬盘 |
450GB SAS 15000rpm |
|
电源供应 |
850W 85%转换效率 / 1110W 89%转换效率 |
|
显卡 |
NVIDIA Quadro NVS 295 或 FX 380 |
|
计算处理器 |
1 / 2× NVIDIA Tesla C1060 |
|
价格 |
49800 / 66000元 |
科卓Quadro 8120-TC高性能计算工作站和上一代产品Quadro 8100-TC系列的最大区别在于将主机平台从惠普HP xw8600升级为新一代的HP Z800工作站。随之而来的就是基于Intel Nehalem架构的Xeon 5500系列处理器、6通道DDR3内存,以及最大功率和转换效率更高的电源等。下面我们就来说明一下选择HP Z800的原因。
为什么要选择HP Z800工作站?
记得我们曾经在2008年1月向大家介绍过Intel上一代双路Xeon平台5400(详见:“Intel 5400平台为工作站带来新动力”一文)。与5400只是在Xeon 5000系列基础上提升了部分规格不同的是,HP Z800工作站使用的Intel Xeon 5500平台完全是具有革命意义的新一代产品。
更高的CPU内核执行效率、整合内存控制器
首先Intel Xeon 5500系列CPU在之前Core架构核心的基础上整合了内存控制器,用QPI直连总线取代了之前的FSB前端总线;此外还加入了原来曾经在NetBurst架构Pentium 4/D处理器上应用过的Hyper-Threading超线程技术、以及新加入的Turbo Boost智能加速技术等。在已经进行过的各种服务器应用测试中,Xeon 5500平台的性能超过Xeon 5400系列20~157%之多。这些新技术我们将在下文中分别为大家介绍。

Intel Xeon 5500系列处理器规格
Intel Xeon 5500系列CPU分为L、E、X、W四种类型,其中低功耗的L系列和最低的一款E5502双核HP工作站没有提供;2款入门级四核E5504、E5506只有4MB三级缓存、4.8GT/s QPI总线频率,内存支持到DDR3 800;主流的3款E5520、E5530和E5540拥有8MB三级缓存,QPI总线频率5.86GT/s,支持DDR3 1066内存,并提供了SMT(超线程)和Turbo Boost智能加速技术;再往上的X系列提供了目前最高的6.4GT/s QPI总线频率、DDR3 1333内存规格,同样支持超线程并且Turbo Boost加速的级别更高,3款高性能Xeon X55x0处理器的TDP(热设计功耗)由E系列的80W提高到95W;最高的W5580在主频达到3.2GHz的同时,最大功耗也达到了130W。
以我们在科卓Quadro 8120-TC高性能计算工作站上选择的Xeon X5550 CPU为例,虽然它的标称频率只有2.66GHz,但由于采用了全新的设计(后面陆续说明),实际性能超过上一代产品科卓Quadro 8100-TC推荐的Xeon X5450 3.0GHz。虽然X5550的三级缓存容量看上去要比上一代5400系列的12MB二级缓存少,但2者在设计上有所不同。Xeon 54xx处理器内部包含2个Die(内核),每个Die上拥有2个核心(Core)和共享的6MB L2 Cache,也就是说将2个双核处理器内核封装在一起,然后连接到同一条FSB(前端总线)上;如果其中一个Die上面的核心恰好需要另一个Die上L2 Cache中的数据时,需要经过前端总线(也就是北桥)中转。而Xeon 5500系列CPU则不同,4个核心共享8MB L3 Cache,在这点上类似于AMD K10的“原生”四核架构;并且每个核心的一、二级缓存数据在L3 Cache中都有完整的映像,查询和访问时不再需要经过北桥和系统内存,因此效率更高。
Intel Turbo Boost智能加速和Hyper-Threading超线程技术

Intel Turbo Boost频率提升示意图
Turbo Boost智能加速技术是Intel针对以前的多核处理器在执行单线程应用时效率提高不大,部分资源闲置的问题而设计的。支持Turbo Boost的Xeon 5500系列CPU在常规状态下保持默认频率(如果打开EIST节电功能,闲置时主频将低于标称频率);当4个核心中的1~2个被应用程序占满时,处理器主频将以133MHz为单位提升2~3个档次;而当运行的程序占满了3~4个核心时,CPU主频也能够提高1~2个档次(×133MHz)。一旦出现处理器的满载运行功耗超过TDP值,Turbo Boost技术将会自动关闭,因此不会对散热和稳定性造成影响。
前文处理器规格的图片中,每个系列左侧的“Turbo:X/X/X/X”代表CPU分别在使用4/3/2/1个核心时的Turbo Boost频率提升级别。以我们选择的Xeon X5550为例,“2/2/3/3”表示在单线程应用时频率能在标称的2.66GHz基础上提高400MHz(133×3)达到3.06GHz,而在4个核心都有负载时也能够提升266MHz(133×2)至2.93GHz。在特殊情况下,我们甚至可以在主机BIOS中关闭多核功能,这时X5550就可以相当于一个3.06GHz主频的单核处理器了。在不同档次的Xeon 5500 CPU中,X系列支持Turbo Boost频率提高的幅度最大,这也是我们在3款中选择的原因之一。
Hyper-Threading超线程技术用在这里已经是新瓶装旧酒了,它的目的是进一步提升Xeon 5500在多线程应用中的性能表现。一颗四核处理器拥有8个线程,两颗就是16个线程,这在目前的双路系统中应该是最高的。
|