生态社区 | 构建多层次生成式 AI 解决方案,英特尔® 至强® W 助力“最后一公里”
AIGC 助力创新井喷近年来,AIGC 在文生文、文生图、文生视频等方面的应用愈加广泛,极大地推动了各行各业的创新与发展。据《中国 AIGC 应用全景报告》显示,2024 年中国 AIGC 应用市场规模将达 200 亿元,2030 年达万亿元规模。随着多模态预训练大模型等底层技术的逐渐成熟,AIGC 在音图视频上展现出更强的能力,赋予行业创作更多想象与落地空间。一方面,图像生成在工业设计、平面设计、插图设计、游戏动画制作等数字设计领域快速应用,AIGC 可辅助搜集素材、快速生成草稿,降低设计创作门槛。另一方面,视频生成在建筑设计、工业设计、游戏设计等行业中,可提供更加直观的演示效果,显著缩短工作时长。
这些 AIGC 创新和应用的背后,离不开多样性的算力支持。作为中国领先的计算产品方案提供商,宝德计算凭借丰富的市场经验和对客户 AI 需求的深刻洞察,携手英特尔 AI 软硬件基础技术,提供了多层次的、软硬一体化的 AI 解决方案。宝德 AIGC 解决方案既可以集群部署也可以单机部署,方案架构包含硬件层、平台层、服务层和应用层。
- 在硬件层,宝德充分发挥了 20 年服务器行业技术积累,提供涵盖 AI 训练服务器、AI 推理服务器和 AI 边缘产品等多平台选择和可兼容,进行模型的高速训练、微调和高效推理。
- 在硬件基础上,方案采用 K8S 进行集群资源管理(单机部署采用 Docker)。
- 基于雄厚的硬件层和平台层,在服务层部署了 ChatGLM 大模型推理服务、由 GLM 微调而来的行业大模型、宝德自研的嵌入数据仓库服务,可以将行业数据转换成向量数据,存储到向量数据库中,通过相似度匹配算法查询出相关内容交给大语言模型进行推理、LLM Functions 服务,主要让大语言模型拥有调用后端接口的能力。
- 基于这些硬件和服务,宝德开发了诸如聊德宝、AI 客服和数字人等多种 AI 应用,可广泛服务于行业大模型、智能语音助手、网络直播、线上教育和培训等领域。
大模型落地“最后一公里”
设计师等群体利用 AIGC 加速创意流程,以及中小企业落地 AI 大模型应用的二次开发、数据预处理等需求,既不像构建全新大模型般需要大量 AI 算力,又不是普通电脑算力可以承担,宝德专门为此类应用场景打造了搭载英特尔单路最强“芯”至强® W 处理器的图形工作站系列产品。
面向 AI 的计算平台需要更高的性能、更大的内存空间、更强大的 PCIe 扩展能力,以应对多层次的 AI 算力需求。作为单路计算的最强“芯”,英特尔® 至强® W 处理器以其高主频、大内存、高算力、高可扩展性等优势,以及专为 AI 优化的指令集,可以轻松应对 AIGC 各类场景的算力需求。其高达 112 路的线程处理能力,支持多达 6 张显卡,以及容量高达 4TB 的 DDR5 ECC 高速内存加持,为计算密集型任务提供了充足资源,并具备良好的成本优势。
至强® W 处理器与英特尔® 至强® 可扩展处理器同宗同源,拥有强大的计算能力、出色的稳定性以及良好的兼容性。至强® W-3400/W-2400 系列采用 Sapphire Rapids 架构和 Intel 7 制程工艺、全新 Golden Cove 内核架构,并加入了全新的嵌入式多芯片互连桥接(EMIB)封装技术,带来了出色的可扩展性和更强大的性能。它支持 DDR5 RDIMM 内存、PCIe Gen 5.0 和 Wi-Fi 6E,还具备英特尔® vPro® 技术、 ECC 内存,以及 RAS 技术,可确保最大限度地延长工作站等系统正常运行时间,快速处理数据和指令,从而加速工作流程,适用于媒体和娱乐、生命科学、金融服务、工程、能源和地球科学、数据科学和 AI 开发等广泛应用领域。
宝德计算与英特尔密切协作,第一时间打造和同步升级工作站新品到至强® W 处理器,并不断进行适配、测试和产品化、市场化。从产品路标看,宝德基于至强® W 处理器的产品规划涵盖了至强® W 全系列,致力于为数字设计、影视动画、云游戏设计、模拟仿真和虚拟现实等专业领域以及 AIGC 新创新和应用提供经济高效的算力引擎。
趁手兵器按需选择
宝德图形工作站 PT6630W2 采用至强® W-3300 系列处理器,支持 PCIe 4.0、双宽 GPU 加速卡、最多 8 块热插拔 3.5/2.5 英寸 SATA/SAS 硬盘,具备丰富的异构扩展性和灵活的连接能力,可支持大模型快速导入导出,从多方位驱动 AIGC 算力,满足不同行业用户的多样化需求。它拥有 16 个 DDR4 内存 DIMM 槽,具备出色的图形处理能力和数据计算能力,并且提供人机共存的静音环境,非常适合图形渲染、多媒体编辑等处理工作。
宝德 4 卡液冷图形工作站 PT6630W3 和宝德图形工作站 PR4630W3 都采用至强® W-3400/W-2400 系列处理器,拥有 6 个 PCIe 5.0 x16 Slots 和 16 个 DDR5 内存 DIMM 槽,最大支持 4 个双宽 GPU 加速卡,支持最新 400Gb/s 高速网卡和多盘位扩展,为大模型的数据吞吐提供充裕的带宽,确保图形计算和渲染的流畅稳定运行,极大地提升了 AI 训练的效率,助力客户轻松应对各类复杂的 AIGC 应用,并且具有静音降噪和机塔互换的灵活选择和优秀的经济效益。
PT6630W3 采用创新的液冷技术,能够降噪减碳,实现从 CPU 到显卡的高效散热,进一步助力客户降本增效。
PR4630W3 采用 4U 机塔互换机箱设计,整机使用性能、密度和扩展性最大化,适用于各种数据中心和机房场景。
结语
随着社会数字化和智能化转型加速和 AIGC 创新应用,AI 算力需求将更加具体化和多样化。大模型进入人们视野的初期更依赖部署于云端的算力,通过网页或类似于 Copilot 这样的助理提供交互式的人工智能服务。随着越来越多、越来越强的大模型开源,基于用户专有数据的 AI 应用也得到了充分的重视。部分垂直行业和企业用户利用开源模型和调整过的算法对本地数据做训练和处理,通过训练专有的垂直领域模型提高了 AI 的专业性,又保护了私有数据和知识产权。英特尔® 至强® W 的多核心、高频率、高扩展、高稳定等特点,在以 AIGC 为代表的私有化部署方面体现了更高的适应性,涌现出了一系列经验证的、可用的、稳健的企业级 AI 解决方案。英特尔携手宝德打磨的基于至强® W 的多层次、多样化的 AI 算力产品和方案,加速数智创新应用,助力进一步释放新质生产力。
Xeon® W社区
Xeon® W社区是英特尔® 合作伙伴联盟联合益企研究院构建的开放、协作社区,聚合产业链上下游企业,实现协同技术创新,共同打造开放、创新、贴近用户场景的产品与解决方案,促进合作伙伴的共同发展,帮助用户把握AI时代创新应用的勃勃商机。