全国政协委员张云泉:算网融合 算力市场五大门派“华山论剑”
最近,业界首个以算网融合为核心的多元算力研究报告《算力经济时代·2023新型算力中心调研报告》出版,我们将对报告内容开启连载模式。
感谢第十四届全国政协委员、九三学社中央科技专委副主任、九三中央科普工委副主任,中科院计算所张云泉研究员为本报告作序。
本文也阐述了目前几大热点问题:
- 如何区分狭义算力经济和广义算力经济?
- 算力服务产业的四类商业模式包括哪些?
- 算力网络“五大门派”是谁家?
- 为何算网融合催生新变局?
在今年两会期间,我递交了一份关于算力发展的提案:关于合理规划算力网建设,确保东数西算健康发展的提案(W01072) ,核心内容是算力网和东数西算。在《算力经济时代 ·数字中国万里行 2023 新型算力中心调研报告》出版时,我希望通过这篇文章来解释这份提案产生的背景,同时也对当前算力经济的发展、算网融合带来的新变局做一些分析。
当人类社会从热力时代过渡到算力时代,计算也随之成为未来智能设备的关键驱动力,这点在数字经济时代尤为突出,算力经济名词也在 2018 年被提出。
一、从洞察算力到提出“算力经济”
算力经济最初定义的维度是比较简单的。
在从事超级计算 30 余年的过程中,我对计算技术的发展和应用有深刻的理解,早期的超算并不倾向于使用 GPU。2008 年英伟达提出Fermi 架构,将显卡扩展为通用计算 GPU,希望用在超级计算机上,但在当时,GPU 在科学计算的应用都不是很成功,如超级计算机中的曙光星云、天河 1、天河 2 等在使用中的效果没有达到预想效果。
到 2010 年,我们团队整理中国高性能计算机 TOP100 排行榜的计算机结构后发现,CPU+GPU 正成为超级计算机的技术发展趋势。
这一趋势在 2015 年之后更为明显,AlphaGo 围棋大战之后,人工智能取得成功,发现 GPU 其实更适合深度学习,英伟达将 GPU 的应用重点 从超级计算机转到人工智能上。
一直以来,超级计算主要是做科学计算和基础研究,需要具备长期投资的理念,很难直接和国民经济发生关系,地方政府在算经济账时,会考虑投资的回报率是多少、投资周期是多长?多少年能收回投资成本?能拉动多大的经济增长?因此说服政府投资超级计算平台很难。
2018 年,有了“算力”这个名词后,这一问题出现了转折点。起初算力这个词来源于区块链、挖矿领域,相对比较狭窄、有点偏负面。
但随着超级计算和人工智能、云计算的结合,甚至包括区块链和大数据的融合,“算力”似乎和国民经济的关系更密切了。过去面临的关于超算的经济回报问题, 在人工智能时代(我们称之为“智能计算时代”) ,应该可以说清楚了。基于这个想法,在区块链的启发下,国内的专家们开始把超级计算的“计算”,泛化成“算力”。
2018 年,我参加地方政府的相关活动时提出“算力经济”这一理念,当时认为,随着超级计算技术的发展,大数据、云计算、人工智能、区块链彼此之间的融合创新,算力经济会成为经济发展的重要抓手,会成为地方政府新旧动能转换的重要手段。但在那时,“算力经济”其实还不太被社会接受。那时最热的是大数据、人工智能、区块链, 但算力不热, 没什么人谈“算力经济”。
这一观点在随后就得到印证,2018 年益企研究院(E企研究院)开启数字中国万里行,实地考察了全国 8 个超大规模云数据中心,并出版了首个《中国超大规模云数据中心考察报告》聚焦数据中心架构创新和技术迭代,探索智能基础设施的上层应用,呈现新技术和新型算力基础设施的价值。
2019 年发布的中国高性能计算机 TOP100 排行榜中我们发现,这一年超算应用的领域也发生了极大的变化。过去超算主要集中于科学计算、政府行业、能源行业、电力行业以及气象领域。但随着许多互联网公司开始申报超级计算机, 在 TOP100 中,有 30% 的系统都来自互联网行业,比如云计算、机器学习、人工智能、大数据分析以及短视频领域。这些领域对于计算需求的急剧上升,超级计算继续与互联网技术进行融合。
同时,算力基础设施中除了云数据中心和超算中心,还出现智能计算中心为代表的算力基础设施。其中较为典型的案例就是国家超算济南中心科技园与腾讯在上海松江打造的人工智能计算中心。
2020 年,益企研究院发起数字中国万里行第三年之际,我在接受益企研究院访谈中,正式提出:我们即将进入一个依靠算力的人工智能时代,这也是未来发展的必然趋势之一,同时,随着用户对算力需求的不断增长,算力经济时代将登上历史舞台。
2020 年后,我在相关调研实践中不断总结,最后形成了“超算与人工智能融合创新的算力经济时代”的思考。
二、狭义算力经济与广义算力经济
中国高性能计算机 TOP100 排行榜已经发布了 20 多年,行业一直通过排行榜观察中国超级计算产业的发展趋势。到 2021 年,我们又发现一个新的现象:在 TOP100的前 10 名有 7 台机器,它们不是专门服务某些行业,而且这些机器没有具体的应用目标,是公司买过来之后专门用于卖算力的,而且这些机器性能很强。面对这个新出现的状况,TOP100 的专家委员定义了一个新领域叫算力服务业。
当时间进入 2022 年,算力服务的性能指标相比上一年已经翻倍,增长速度很快。算力服务业在 2021~2022 年的异军突起,也意味着中国正式进入算力经济时代,其背后的原因是超级计算技术的发展,大数据、人工智能、区块链彼此之间的融合创新,而这些因素背后的核心要素就是算力。算力应用已经开始渗透到千行万业之中,这也是在 2018 年提出算力经济概念之后,我们观察到这个行业的极速变化。
算力经济最初定义的维度是比较简单的。首先计算要成为算力经济的核心,未来,以计算能力来衡量一个地方或地区的数字经济发展水平,使之成为一个很重要的指标。一个地区的算力产业是不是发达,也意味着数字经济是不是有机会,尤其在东数西算成为国家发展战略之后,算力经济也成为西部地区新一轮经济发展的强力抓手。就目前来说,针对算力还没有一个统一的定义,我们可以将其理解为硬件和软件的配合,共同执行某种计算需求的能力,这个定义现在看来不是很全面。
我认为狭义的算力经济定义是指与算力强关联的算力服务产业链,其中包括了 4 类参与者:一是算力生产者,二是算力调度者,三是算力服务商,四是算力消费者;他们共同闭环成为一种商业模式。
随着认识的深化,随后又有一个广义的“算力经济”,我们称之为算力+。这不是我一个人提出来的。凡是可以用到算力的国民经济的各个方向单元,都是算力经济的范围。只要以算力为核心生产要素,以算力为引擎,就都是广义的算力经济。这是数字经济很重要的一个组成部分,在数字经济中的比重会越来越大。统计数据显示,在世界各国的算力排名中,中国排在世界第二,人均算力处于中等国家的水平,目前中国还是有很大的算力鸿沟。在我国,算力的需求毋庸置疑,人工智能、5G、区块链、元宇宙的发展都对算力提出了强烈的需求,其增长前景是没有问题的。
现在有各种各样新的概念,很多课题组也开展了很多研究。在针对算力研究的著作中,《算力:数字经济的新引擎》这本书正式把算力进行系统的研究,提出来无数据不经济,这个定义非常好,比算力经济最初的概念更近了一步,提出了引擎性自主创新驱动的先进计算产业以及算力赋能和服务衍生的新模式、新业态形成了算力经济,作者是经济学家,经济学角度阐述了算力对于经济的巨大影响力。书中指出,算力经济是数字经济衍生的新经济形态,数据作为主要的生产要素通过算力、算法的技术创新,促进数据经济和实体经济的深度融合,实现效率、效能、质量提升和经济结构优化升级。
综上所述,围绕算力本身产生的算力服务产业中,我们看到里面有芯片、操作系统,我认为可以从狭义和广义两个角度来看算力经济,狭义的算力经济指算力服务业产业链;有更广义的算力经济叫数字产业化、产业数字化、城镇数字化这种提供各种基础设施、提供各种支撑保障的新 模式、新业态,也就是是算力+产业。
三、AGI时代来临,模型服务(MaaS)商业模式呈现
随着算力经济的发展,超级计算机技术和人工智能融合创新会产生一类新的基建,专门用于人工智能计算的中心,也成为当下非常热的资产中心。就在 ChatGPT 面世之前,我们还不知道大模型可以实现令科技界为之兴奋的应用水平,只是知道它可以写一点新闻、聊天、画画,这些简单的功能会在更多应用场景中带来价值。
从 GPT3 到 ChatGPT 的过程,是大模型技术发展的关键节点,也是中国人工智能之路和美国人工智能之路的分歧点。这两年大模型国内也有相当数量的公司参与其中,但我们追求的是参数量,从千亿级到万亿级很快的跃进,但是智能属性没有涌现。OpenAI 走了另外一条路,利用人工反馈的训练机制,通过标注、对齐高质量数据,最后把这条路走通了,用千亿参数的大模型把通用智能挖掘出来了,这个事情是值得国内科技界去反思的。
另外一条路是人工智能内容生成 AIGC,包括大家在微信朋友圈里看到各种画,也成为现在的热门赛道。在 AIGC 赛道国内已经有布局了,从上游、中游到下游都有一些中国公司在做。
这些都意味着人工智能进入通用人工智能(AGI:Artificial General Intelligence) 时代,具备五个特性:涌现性(参数超过临界值,模型能力实现突变) 、工程化、通用性、密集型、颠覆性。这里就不多展开阐述。
四、科学计算:传统科学与AI深度融合
当计算改变科学,人工智能生物算法反过来被融合到科技计算建模中,相当于把数据科学和计算科学(AIfor Science)整合在一起,这时产生一个新的“智能科学”赛道。以前科学计算的四个范式分别是实验科学、理论科学、计算科学和数据科学,智能科学范式(AI 范式)被称之为第五范式。其代表是斩获 2020 年戈登贝尔奖的 Deep Potential 方法展示了 AI 和分子动力学模型的有效结合,在保证精度的同时,指数级地提升了物理模型的效率。
基于科学计算的深度学习怎么反哺科学计算、解决计算问题, AI范式确实创造了新的科学计算的方向,尤其是制药这个行业特别有效,极大提高了科学计算的精度,降低了成本。比如近年来,AlphaFold等人工智能(AI)工具的出现,在生命科学领域促成了多项突破性进展。蛋白质的功能预测与设计成为最先受益的领域之一,在《科学》(Science) 杂志上,Baker 教授团队带来了蛋白质设计的又一项革命性突破:利用强化学习,“自上而下”(top-down)设计蛋白质复合物结构。在几年前,预测蛋白质三维结构都遥不可及,更不用说从头进行设计了。这套颠覆了传统方案的全新突破不仅可能为我们带来更有效的疫苗及药物,还有望引领蛋白质设计的全新时代。
AI for Science 的数据来自各个学科的数据积累;模型来自各领域科学家发现的科学原理和规律;算法源自机器学习算法和数值方法等方面的创新。需要多样算力融合的综合型智能计算平台,通过分布式异构并行体系结构,实现多样算力的融合、优势互补,为AI训练、AI推理、数值模拟等不同应用提供不同算力,实现高精度到低精度算力的全覆盖、多种计算类型的全覆盖,以及 AI 训练 + 推理全覆盖。
五、算网融合 算力市场呈现五大门派
在算力布局方面,国内目前有很多算力中心,有超算中心、智算中心,还有超大规模云数据中心,我认为未来算力中心慢慢会融合到统一的形态上,只是功能不同。
随着算力中心的发展,我国的算网融合也取得了长足的进步。“东数西算”的的关键是“国家枢纽节点之间进一步打通网络传输通道”、“优化东西部间互联网络和枢纽节点间直连网络”,“提升跨区域算力调度水平”。算力网络,是一种根据业务需求,在云、网、边之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。算力网络体系包括算力度量、算力感知、算力路由、算力编排、算力交易等内容。
目前,中国联通、中国移动、中国电信的算网融合战略很清晰,标准也很清楚,他们将通过实施算网融合战略转型为算力供应商。而在算网融合进一步发展中,目前行业内出现五大门派,我形象的概括为算网融合“南帝北丐、东邪西毒、中神通”。
- 南帝:中国算力网,是鹏城实验室以“鹏城云脑”为初始枢纽节点启动,以智算中心为基础,实现全国大型算力的协同调度和高效计算,在2022年6月正式上线“智算板块”。采用算网融合技术,希望将全国智算中心连接起来,统一规划、统一调度、统一运维。根据官方数据,“中国算力网”已接入20余个异构算力集群,汇聚算力规模达3E,其中自主研发的AI算力超1.8E,初步满足了粤港澳大湾区数字经济与智能产业发展急剧增长的超大规模算力需求。
- 北丐:国家超算互联网联合体,该联合体以互联网的思维运营超算中心,并连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,构建一体化超算算力网络和服务平台。从整体构架上看,算力网络的架构可分为三层,从下至上依次为基础设施、编排管理和运营服务层。通过市场化的运营和服务体系,实现算力资源统筹调度,降低超算应用门槛。
- 东邪:算力互联,是在中国科学院科技算力基础设施建设运营实践基础上由计算与通信产业链相关企业联合发起,以HPC、AI、云原生为主的科技算力基础设施运营与多云互联科技计算云服务、面向科技和产业的算力服务通信基础设施运营与科技算力互联网。算力互联全国一体化算力调度服务平台ACLink™和全国一体化算力服务通信网络ACNet™为核心的算力互联网基础设施,以“资管+交易”模式开展“自营+互联”算力基础设施全国布局,希望打造算力互联与算力智能的技术体系与经济体系。
- 西毒:中关村超互联新基建产业创新联盟(简称“超互联联盟”),提倡和推广的“超互联新算力”新型基础设施,该联盟提出城市算粒(Computinglet)的理念,解决支持大规模预训练和推理的技术难题,充分利用和赋能已有的第三方中立数据中心资源,打造自主可控的国产GPU算力池,同时使用原创的、安全高效的超互联计算总线协议,将分布式算力池连接起来,实现“城市就是一台计算机”的建设目标。从技术层面来看,超互联新算力利用一系列开放体系架构、标准和协议将地理分布、产权各异的算力资源有效整合调度起来,为新一代人工智能应用场景和大模型训练任务提供充沛的算力供给。
- 中神通:中国信通院北京算力互联互通验证平台。大模型训练场景对算力互联互通提出了架构互通、高速互联需求,东数西算场景对算力互联互通提出算力标识感知、算网资源解析和一体化调度需求。今年中国信通院牵头成立“中国互联网协会算网云协同系统工作委员会”,旨在促进算网云产业协同发展。在完成北京算力互联互通验证平台二期成果发布时,中国信通院提出算力互联五通五层模型以及“三位一体”实现路径,通过算力注册感知、算网参数调度、身份认证管理、统一计费度量等公共服务,构建架构互通、高速互联的标准化环境,降低算力服务商算力互联互通成本,继而实现“一点接入、全算贯通”。
“五大门派”拥有不同的技术派别,通过解决异构算力数据中心的互联和互通问题,最后实现全国统一的分布式的异构资源的调度,提高运营效率,这也意味着算力市场“华山论剑”正式开启。(后续我们将继续剖析)
六、用算力服务标准确保算力服务健康发展
对于未来的展望讲过很多,东数西算工程标志着算力经济时代正式的拉开帷幕。未来,算力将加速普及,类似于电力插座变成算力插座。我们使用算力不需要带一台电脑,随便一个卡或者一个东西,就可以通过一个标准的计量方式来使用算力。未来还可能会出现类似于发电厂的算力工厂,尤其在西部地区会出现,据说在煤矿、水电站的附近已经开始建设算力工厂,电力极其便宜,成本特别低。
工业时代有公路、电网,算力时代也有算力网络。随着算力服务的发展, 未来在算网时代有三类不同角色:一是网络通信商,通过算网融合参与进来;另外超算的供应商、云计算供应商,通过超算互联网也会参与提供算力服务;还有国家电网通过建设发电厂,参与提供算力服务。三类角色从不同的技术途径抢占算力服务市场。
基于此,市场也在呼唤算力服务标准,确保算力健康发展。2023年数字中国万里行暨算力中国行即将开启,希望有更多的力量参与到算力+产业的考察实践中,推动中国算力经济的发展和升级。