好内功加屠龙刀:解析联想ThinkStation P520c工作站
如果您在创造上天入地的国之重器,喜欢什么样的神兵利器?答案当然是高性能工作站。
提到工作站人们最熟悉的就是设计院、艺术工作室等场景,譬如繁重复杂的图形工作,譬如建筑师、工程师们指点江山的各种图纸、各种零部件的3D造型、仿真效果,还有天书般的电路图,这些工程设计类的需求占据了三分之二以上的工作站市场需求。工作站的另一个重要领域就是丰富多彩的多媒体娱乐内容,不论是2D的还是3D的图片、动画、游戏,包括视频剪辑与特效,越精美的作品出自工作站的概率就越高——很容易想象,这里面凝结的不仅仅是艺术家的灵感和心血,也需要澎湃的性能做支撑。
除了性能,优秀的工作站还必须具备企业产品那般优异的RAS特性和强大的扩展性,又要兼具个人电脑良好的交互体验。
近期送到我们实验室的联想ThinkStation P520c就是一款典型的主流工作站,采用中塔式造型,主要定位于专业设计、高精度计算领域应用。
ThinkStation P520c造型非常低调,也没有提供太多的接口。这倒是符合多数工作站职能“专一”的定位。当然,外观依旧是Think范很足的,通体黑色,一抹红色。
单看外观,可能会觉得与普通商用机好像也没太大区别,但“ThinkStation”的logo透露了真相。而且,大面积蜂窝状通透的前面板说明这台设备对散热的高要求,看上去,这就应该是个干重活的家伙。
专家级平台 满足多元化应用
工作站就是超强版的电脑?服务器装上显卡就是工作站?
你肯定听过这样的言论,或许身边就有朋友被这样的说法“洗脑”。所以每次提到工作站,总有人会表现出一副无所谓的神态——不就是大号的电脑么?我多花钱,买台配置更好的电脑不就行了?
大错特错。
在测试之前,我们有必要解析一下,为了满足不同企业级客户的场景应用,联想是如何打造专业平台来满足性能、可靠性、可扩展性、安全甚至节能等多种需求的。
专业、强大、高扩展性、高稳定的基本架构
ThinkStation P520c基于Cascade Lake-X架构的单路至强平台,支持W-2100/2200系列处理器,最多可以提供18核36线程。
图注:英特尔至强W-2200家族
这一代至强处理器直连的PCIe通道数量也达到了48条,全平台可支持至72条PCIe通道。除了可以用于高性能GPU外,还有用充足的扩展能力,以支持更强的网卡、更多的NVMe SSD等等。P520c提供了2条PCIe x16插槽, PCIe x4/x8各一条,以及双NVMe M.2插槽。
图注:联想ThinkStation P520c内部
内存的支持能力也是工作站与高性能PC拉开差距的地方,Cascade Lake-X架构至强支持四通道内存,总容量可以达到1TB。有了大内存、大带宽的底子,高分辨率的3D渲染、视频剪辑才会游刃有余。ThinkStation P520c提供了4条内存插槽,是完整的四通道。我们给这台样机搭配单条容量64GB的ECC RDIMM DDR4-3200内存,双通道即可提供128GB的容量。
图注:联想ECC RDIMM DDR4-3200 64GB内存,Micron生产
处理器方面,样机配备的是至强W-2245,是目前市场上比较受欢迎的8核16线程规格,基础频率3.9GHz,睿频4.5GHz。
图注:英特尔至强W-2245处理器
显卡部分则是NVDIA当前次顶配的专业级显卡RTX A5500,拥有10240个流处理器,搭载24GB容量显存。
图注:NVIDIA RTX A5500专业显卡
存储系统:从应用的视角着眼
联想ThinkStation P520c预置了两个3.5英寸硬盘安装位。硬盘预先安装在聚合物托架上,均为免工具的安装方式,抽取方便,也减少了震动。
图注:联想ThinkStation P520c 3.5英寸硬盘托架
对于SSD的支持方面,P520c提供了两个M.2接口,可以安装2280规格的PCIe NVMe SSD。至于双SSD是分工协作,譬如分成系统盘和工作盘,又或者是组成RAID提升性能(RAID0)或可靠性(RAID1),那就看用户的实际需求了。
图注:联想ThinkStation P520c 双NVMe SSD插槽
这组SSD的安装位置还覆盖了散热片,可以让高端SSD的性能发挥的更稳定。毫不意外的,M.2 SSD的安装也是完全免工具的。散热片通过弹性卡口固定,SSD尾部使用插扣。安装位和散热片上都有导热垫,可以兼顾SSD两面的热量。
图注:联想ThinkStation P520c NVMe SSD散热片
如果需要更多的驱动器,P520c还有2个5.25英寸仓和2个3.5英寸仓备用。理论上可以扩展到最多6个3.5英寸硬盘或者10个2.5英寸SSD。另外,利用5.25英寸仓安装光驱、热插拔盘盒等都是可行的。
不论是驱动器的数量,还是散热方面的优化,P520c在存储系统方面的配置对于注重存储性能的用户而言还算不错。毕竟性能越高用户的等待时间越短,尤其是媒体渲染、流体模拟等过程会直接影响用户进入下一项工作——时间就是金钱啊。即使对于那些近乎于实时的操作,譬如工程制图、3D建模等,性能对操作流畅性的影响也是实实在在的,更高性能的处理器、更大的内存、更快的SSD等,让图层移动、模型旋转等等操作少一些卡顿、凝滞感,对保持良好的工作心情大有裨益。
重视节能降耗
联想ThinkStation P520c有两款电源可选,分别为500W和625W,均符合80PLUS白金认证,能效很高,在节省耗电的同时,也减少了废热和噪音。
电源直流输出为3组12V线缆,分别提供给处理器、主板及驱动器、PCIe卡,硬盘供电由主板就近转出。各组线缆长度均根据机箱实际布局做了优化,体现了定制化的优势。简洁的走线除了减少线损之外,最大的好处就是减少了对机箱内散热风道的阻挡。
图注:联想ThinkStation P520c配备的625W电源
贴心散热设计 :充分考虑企业数据价值
联想ThinkStation P520c空间比较紧凑,但散热毫不含糊。机箱整体是前吹后排的散热风道。CPU部分采用塔式风扇,向机箱尾部方向吹风。
机箱上部的热量通过机箱尾部风扇排出。风扇用胶钉固定,减少了风扇震动向机箱的传递,对降噪和减震均有好处。
图注:散热风扇使用胶钉固定
机箱正面风扇将蜂窝状面板外部的冷空气吸入。这里有一个细节的设计,风扇上安装了一个导风罩,将冷空气一分为三。中间部分吹向显卡方向,并带动SSD部分散热片附近的气流;上下两侧吹向两个3.5英寸硬盘位。
图注:前部散热风扇的导风罩
刻意兼顾硬盘的散热是比较少见的设计,考虑到工作站存储的资料价值,这个细节值得鼓励。
超级明星:NVDIA RTX A5500
NVIDIA RTX A5500的Ampere架构核心采用8nm制造工艺,集成了283亿个晶体管。其新的CUDA核心单精度浮点(FP32)性能相比上一代提升了2倍。第二代的RT内核相比上一代也大幅改进了光线追踪性能。
图注:Ampere GA102内核架构
Ampere内核架构可参考上图,完整的GA102核心包含7个图形处理集群(GPC),每个GPC拥有12个SM,所以总共有84个SM。
图注:Ampere SM单元架构
Ampere架构的每个SM包含128个CUDA核心、4个Tensor核心和1个RT核心。一个完整GA102芯片相当于10752个CUDA核心、336个Tensor核心和84个RT核心。
A5500属于这代架构的次顶配产品,其核心拥有80组RT内核、320个Tensor内核、10240个流处理器,单精度浮点性能高达34.1 TFLOPs。
图注:GPU-Z读取的NVIDIA RTX A5500信息
图注:NVIDIA官方公布的RTX A5500规格
RTX A5500整卡配备384bit位宽GDDR6显存,容量达到24GB,而且,支持ECC纠错功能。得益于高能效的设计,桌面版RTX A5500的功耗仅为220W,这也是其可以适应各种工作站的关键点之一。
与游戏卡常见的浮夸造型迥然不同的是,RTX A5500的整体造型设计简洁低调。
卡身采用了标准的双宽设计,不会“多吃多占”其他插槽位了。从显卡顶部还可以看到第三代NVLink接口等。
涡轮散热系统将气流直接吹出机箱,挡板主要部分为排风口。
输出部分,RTX A5500提供了4个DP1.4接口。
辅助供电部分,RTX A5500使用标准的8pin接口,对电源的挑战不大。
全方位实战 多款软件和模型展示硬件加速魅力
接下来是实测环节。先总结一下参与测试的这台联想ThinkStation P520c的配置,毕竟能否充分发挥软硬件的功能和性能是必须刻意关注的问题,尤其工程设计类客户的应用软件并非大众化的。
联想ThinkStation P520c的配置:
处理器:英特尔至强W-2245
内存:ECC RDIMM DDR4-3200 64GB×2(实际运行频率为DDR4 2933)
显卡:NVIDIA RTX A5500
SSD:英特尔S4500 960GB
操作系统:Windows 11 64bit专业版
显卡驱动程序:NVIDIA 517.40
这套平台的性能估计大家应该没有什么意外的。所以,在实测环节部分,我们要为大家亲手验证,中高配的处理器和内存,加上旗舰级专业卡,除了各种软件秀高分、高分、还是高分之外,这套平台能提供什么样的出色效果?
摸底:V-Ray GPU RTX测试 如何凸显专业显卡价值?
图形工作站面向关键和大计算量应用,要求各部件具有较高的稳定性。我们首先来满足一下大家的好奇心:A5500打开显存纠错功能,需要占用多少显存?对性能有多大影响?
图注:NVIDIA控制面板中关于ECC的设置
时至今日,GPU加速遍地开花,专业卡与游戏卡的区别好像又有一些模糊了。这ECC功能就如同工作站与PC的区别一般,是尊严,啊不,是稳定性的保证。确实,工作站和服务器所追求的RAS特性是消费类机型难以企及的。RAS是Reliability、Availability、 Serviceability三个英文单词的缩写,分别代表可靠性、可用性、服务性三个关键特点。
早期的专业软件主要将GPU用于预览的加速,而成品渲染则依赖CPU完成,就是因为担心前者的稳定性。显卡崩溃的隐患包括显存容量不足,以及高速并行接口难以杜绝的错误,也包括计算精度等。但目前GPU的实力已经大有改变,可以完全依赖其进行最终输出。
对于高精度的模拟,以及成品渲染,尽量减少显存错误是有价值的,这是给显存引入ECC的原因。但是,电脑的系统内存,ECC与非ECC的位宽是不同的(通常前者为64bit,后者为72bit),表面上相同的标称容量,后者使用了更多的芯片(通常是8+1的组合。我们使用的内存便是4组各9颗内存芯片)。显卡则没有这个条件,其显存接口位宽是确定的,显存容量是确定的,如果要使用纠错功能,就得从已定的显存中占用一部分容量和带宽。
所以,专业显卡拥抱ECC的代价是什么呢?
现在就来揭晓:打开ECC前,RTX A5500的显存是24GB;打开ECC后,显存变为22.5GB。
图注:ECC关
图注:ECC开
可以看到,开启ECC只消耗了1.5GB的显存容量,相当于6%。对显存带宽的影响也大致在这个范围,完全可以接受。
体现在最终性能上,以V-Ray GPU RTX测试项为例,性能差距小于2%,完全值得长期开启ECC。
图注:V-Ray GPU RTX测试,ECC关
图注:V-Ray GPU RTX测试,ECC开
图注:V-Ray GPU CUDA测试,单GPU,ECC关
图注:V-Ray GPU CUDA测试,单GPU,ECC开
顺便说一下,在V-Ray Benchmark中,这台ThinkStation P520c的GPU CUDA测试中,GPU+CPU共同加速的得分为2032vpaths。
在负荷相对轻的Blender Benchmark的测试中,是否开启显存ECC对性能的影响可以视作为误差,三个场景的得分高低均有,没有体现出倾向性。
图注:Blender Benchmark,ECC关
图注:Blender Benchmark,ECC开
在CineBench15中,这台ThinkStation P520c的OpenGL测试为101.40fps,CPU子系统为1714cb。细心的读者可能会发现,我们的CINBENCH R15截图中,处理器部分还有个更高的得分:1823(柱状图第一行的深棕色)。这是我们把内存插满4通道后的参考成绩。内存通道翻倍后,OpenGL成绩也会进一步提升到116.71fps。
图注:CINEBENCH R15
联想ThinkStation P520c在NVIDIA RTX A5500的加持下,在V-Ray、Blender中取得了亮眼的成绩。那么,在其他专业设计软件,如3ds Max、Maya、Creo、SolidWorks等软件中的表现,我们留待下一期文章继续展开。