宝德CAE高性能解决方案
如今,算力已经成为数字时代发展的源动力,这也使得 HPC(高性能计算)有 了更多用武之地。在云计算、大数据、人工智能、物联网、5G 等多种应用创新 的推动下,社会对于 HPC 的需求正在快速攀升。而 CAE 即计算机辅助工程设计,是以现代计算力学为基础,以计算机仿真算力为手段的工程分析技术,是实现产品优化设计的主要支持模块。宝德的 CAE 高性能计算解决方案是专为满足大规模分析计算的需求而设计的超 并行计算机集群系统。CAE HPC 解决方案遵循英特尔开放的 HPC 生态系统架构,并系统地部署所有硬件和软件。
———宝德计算IA BU通用计算部部长刘磊
背景
目前,在航空、航天、能源动力等工业领域,利用 CAE 在 HPC 集群上进行反复 设计、分析、优化已成为标准的必经步骤和手段,不同的 CAE 应用程序对硬件 资源例如处理器、网络和存储的要求各不相同,并需要投入大量的资源进行选 择、部署和维护。对于在 CAE 领域部署难、选型难、维护难等问题,宝德推出 了面向 CAE 的 HPC 解决方案,在简化 HPC 集群部署的同时,提供高度的灵活 性、可扩展性和高性能,为 CAE 领域的发展加油助力。
解决方案
宝德 CAE 高性能计算解决方案为集群架构,采用基于第四代英特尔® 至强® 可扩展处理器打造的宝德PR2715E 为计算节点,以及全新一代AI服务器PR4910E 为GPU加速平台。所有硬件和软件都部署在系统中,以打造实现高效并行、协同仿真、数据安全共享一体化。
宝德高性能集群服务器均采用X86-64平台,属同构系统,可共享软件资源和数据存储空间,资源调度简单,节点配比可灵活调整,适应各种应用需求,能够有效降低用户的 总体拥有成本。
方案配置
硬件方面,宝德 CAE 高性能计算解决方案的计算节点通 过标准开放的高速网络实现互联,运行开源 Linux 系统,提供单一系统接口到外面。它是为大规模科学并行计算而 设计的。兼具事务处理和网络信息服务。
软件方面,宝德集群系统配置丰富的软件系统,包括操作系统、编译器、调试器、函数库、并行通信库、全局共享 并行文件系统等基础软件。
1. 计算节点
宝德PR2715E 是基于第四代英特尔® 至强® 可扩展处理器打造出的一款2U服务器产品,最大支持2 颗第四代英特尔® 至强® 可扩展系列处理器,可提供强大的计算能力,帮助用户应对较重的计算压力。它采用Intel C741系列高性能芯片组,支持第四代英特尔® 至强® 可扩展系列处理器,该机型最多支持内存容量8 TB,默认支持8块热插拔3.5英寸硬盘,可选支持12/24盘版本,并可灵活扩展全高全长的PCI-E设备。高集成度的设计在有限空间内带来强劲的性能表现足以支撑关键任务的运行。PR2715E提供先进的管理功能和存储技术,具有可靠的可扩充性和高可用性。
2. GPU加速节点
全新一代AI服务器PR4910E是宝德公司新推出的一款4U双路机架式加速计算服务器。采用Intel C741高性能芯片组,支持第四代英特尔®至强®可扩展处理器;该机型拥有32个DDR5 DIMM插槽;默认支持12块3.5英寸热插拔SAS/SATA/NVME硬盘,可选8/16/24块2.5英寸热插拔SAS/SATA/NVME硬盘;板载支持2个M.2 NVMe或M.2 SATA3硬盘;支持通过线缆和软件支持切换不同的拓扑模式;支持10个全高全长双宽的GPU插槽,默认1个OCP3.0网卡插槽;支持多种不同网络选择:以太网、InfiniBand,OPA;可实现高速性能和I/O灵活性,满足不同应用程序的互联需求; 板载集成BMC;支持IPMI 2.0远程管理; 支持4个2000W&2700W&3000W 冗余电源。
3. 分布式存储系统
为了应对多数CAE软件并行扩展性好、算例数据量大的特点,宝德高性能集群配置了PL-XDFS分布式并行存储系统。宝德推出的PL-XDFS支持海量数据,在线扩容,存储容量和聚合带宽同步提升,满足了高通量计算对存储系统的需求。
4. 高速网络交换
集群配备了高带宽低延迟的Infiniband高速网络,满足了应用软件中各类MPI程序数据交换需求,提高了多节点之间的并行效率,加快模拟计算过程。
5. 软件系统
宝德Powercloud集群管理和作业调度系统,实现设计、仿真平台的统一门户,一体化管理,监控管理和作业调度。
6. 编译器方面
支持Fortran77/Fortran95/C/C++等,并支持OpenMP 以及MPI 程序编译。此外, 我们还提供并行程序调试及调优工具,以帮助用户更好的完成程序开发。宝德高性能集群系统配置丰富的数学函数库和并行环境供用户选用,包括Goto、Lapack、FFTW、MPICH 等。
方案优势
1. 高计算性能
计算资源丰富,满足 CAE 应用各种需求,提供合适的环境。还采用了英特尔密码操作硬件加速技术来减少加密计算对于性能的影响,保证资源的高效利用
2. 高通信能力
该方案采用 高带宽低延迟的 InfiniBand 作为通信网络来提升节点间的通信能力,大大降低了通信延迟。并且通 过 IB 交换机实现所有计算节点的全互联。
3. 高可靠性
整套集群采用多种可靠性设计方案大幅度提升系统的可靠性,确保系统无单点故障。
4. 高扩展性
能根据用户需求灵活对现有计算资源和存储空间进行扩展
5. 高安全性
首次引入了 SGX 英特尔软件防护扩展技术,提供可信的执行环境。以及英特尔平台固件弹性技术为BIOS闪存、BMC闪存、英特尔管理引擎和电源固件提供保护,防止外部攻击。还有英特尔全内存加密,可确保从CPU访问的所有内存都是加密的,保障用户凭据等敏感信息不会被窃取。
应用案例
上海石油化工研究院高性能计算项目
上海石油化工研究院主要从事石油化工烯烃和芳烃的化工利用,包括基本有机原料催化剂和工艺技术、精细石油化工催化剂 和工艺技术、功能高分子材料合成与加工等技术领域的研究,研发工作涵盖了自前瞻性探索研究、应用基础研究、成套工艺 技术及配套催化剂研究开发、工程化放大等过程。
上海石油化工研究院采用宝德的 CAE 高性能计算解决方案,实现了高性 能的计算机模拟和计算。方案在宝德对 HPC 深刻理解的基础上结合对用户应用场景的深入分析而设计,特色鲜明。
序号 | 对象 | 特点 |
1 | 计算系统 | 计算系统由 10 台宝德高密服务器(四子星)与 4 台宝德自研的四路胖节点组成, 系统整体理论峰值性能达 到 30.45TFlops,实测性能达到 25.36TFlops,效率超过了 80%。 |
2 | 网络系统 | 采用业界最先进的 InfiniBand 网络技术,满足应用对网络的高带宽和低延时的需求。 |
3 | 存储系统 | 通过宝德 Pstor2000 分布式存储系统,提高 IO 并发访问性能及单一存储容量,实现多通道、 多分区的并发读写和多分区的一致印象和统一管理;高性能、高可扩展、高性价比。 |
4 | 集群管理 | 使用 WEB 界面管理方式,可提供所有组件的最新状态及图形标示的详细信息; 实时状态监控、故障预警, 动态优化调整资源配给和工作策略; 保存并统计分析关键历史数据;直观显现重要信息的变化趋势; 多种错误故障报警方式,日志、审计和报表可供查询;允许加密的远程控制, 可从任何位置控制操作及监控整 体运行状况。 |
5 | 安全系统 | 方案的设计充分考虑科研对于安全性的需求,从计算、存储、网络, 到用户的接入访问、权限控制等,都提供了安全策略。 |
6 | 技术服务 | 提供至少三年硬件免费保修服务,五年免费人工现场技术服务 |
关于方案中采用的英特尔产品和技术
第四代英特尔® 至强® 可扩展处理器为科学计算工作负载带来性能突破,助力缩短实现价值的时间。该平台采用全新架构,单核性能更高,每路配备多达 60 个内核,系统支持 2 路、4 路和 8 路配置。这相当于单核密度最高可达 120 个线程,比上一代产品增加了 50%。该平台在内存和 I/O 子系统方面也做了相应改进。DDR5 内存提供的带宽和速度最高可达 DDR4 的 1.5 倍,传输速率达到 4800 MT/s。第四代英特尔® 至强® 可扩展处理器可为各类快速增长的工作负载提供性能加速。它内置多种针对特定应用的加速器,使 AI、数据分析、网络、存储和科学计算等领域工作负载的性能得到提升
关于宝德
宝德计算机系统股份有限公司成立2003 年,以服务器和 PC 整机研发、生产、销售和为客户提供云计算综合解决 方案为主营业务,致力于成为中国领先的 IT 产品和解决方案提供商,为互联网、 教育、广电、安全、金融、电信、税务、 交通、电力、医疗等行业提供尖端的 IT 产品和服务。多年来,在强者林立的中 国服务器市场,凭借先进的技术和软硬 件综合实力,宝德服务器市场占有率连续多年稳居国内前五和全球前九。
关于英特尔
英特尔(NASDAQ: INTC)作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。