紫东太初2.0大模型携手昇腾AI 打造数字经济的智能底座

历史上,从没有像今天一样,人工智能技术创新的影响能够如此震荡。

从 2018 年第一代生成式预训练模型GPT-1 诞生以来,GPT 系列模型几乎按照每年一代的速度进行迭代升级,2022 年以来,新的通用人工智能开始以更加高效的方式解决海量的开放式任务,它更加接近人的智能,而且能够产生有智慧的内容,也带来了新的研究范式—— 基于一个非常强大的多模态基础模型,通过强化学习和人的反馈,不断解锁模型的新能力。

ChatGPT是AI大模型创新从量变到质变长期积累的结果,是通用人工智能(AGI,Artificial General Intelligence) 发展的重要里程碑。

作为中国人工智能战略的科技力量,中国科学院自动化研究所(以下简称自动化所) 很早就意识到,人工智能落地面临长尾场景应用的“碎片化”和应用开发的“高门槛”等挑战。在长期坚持做科技前沿的探索的同时,于2019年自动化所就成立了中国第一个大模型研究中心,并确立多模态大模型布局,整合自动化所图像、文本、语音等研究方向的优势资源开展集团式攻关。

2021年9月,中国科学院自动化研究所联合武汉人工智能研究院成功发布全球首个千亿参数的多模态大模型“紫东太初”1.0多模态大模型。紫东太初1.0依托昇腾AI澎湃算力与昇思MindSpore AI框架打造,由武汉人工智能计算中心支持孵化。

2023 年始,ChatGPT和GPT-4 再次掀起了人工智能的热潮,并打开了海量的应用场景:生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作……ChatGPT 基于其庞大的算力和算法分析,可覆盖教育、科研、新闻、游戏等行业。

对于大模型技术来说,在经历了注定载入科技史册的技术狂飙后,如何兑现价值,促进产业发展成为大家关注的重点。在2023东湖算力与大数据创新大会上,我们也有幸采访到了中科院自动化所研究员、武汉人工智能研究院院长王金桥,在他看来,目前我们正处于技术兑现价值的破晓。“大模型 + 大算力 + 大数据”成为迈向通用人工智能的一条可行路径。

中科院自动化所研究员、武汉人工智能研究院院长 王金桥

紫东太初,从1.0到2.0版的跃升

提到“紫东太初”的名字由来,王金桥表示,一是紫东太初寓意紫气东来、混沌初开,代表人工智能从专用迈向了通用,从感知智能迈向了认知智能;二是“紫东”与自动化所的谐音相通,代表着自动化所自身的意义和使命。

紫东太初1.0首次实现语音生成视频等功能,向发展通用人工智能迈出了坚实的第一步。而“紫东太初”2.0可融入3D、视频、传感信号等更多模态数据,并优化语音、视频和文本的融合认知以及常识计算等功能,进一步突破感知、认知和决策的交互屏障,让人工智能从感知世界进化为认知世界,延伸出更强大的通用能力。

2023年6月份,中国科学院自动化研究所发布了”紫东太初”2.0,把逻辑推理和代码以及复杂的计算都融入到了大模型当中,从而实现了全模态多任务的一站式的生成学习框架。由于采用的是强化学习方式,使它能够融合多任务的能力,更好地学习不同模态之间的全模态分组的对其和分组的关联,以及多模态的认知解码,从而延伸出更加强大的通用能力。围绕”紫东太初”2.0全模态大模型,中科院自动化所联合武汉人工智能研究院,利用昇腾Atlas系列硬件及昇思MindSpore AI框架,推出”紫东太初”大模型开放服务平台2.0,加速大模型的产业化落地进程。

据了解, “紫东太初”大模型开放服务平台2.0有四大特性:

第一开箱即用,内置紫东太初2.0预训练基础大模型,开箱即用;

第二快速定制,提供完整大模型微调工具链,支持大模型在各种场景下的自动适配,不需要写代码直接人机对话快速定制用户专属行业模型。

第三一键部署,一键即可以实现云、边、端全场景部署。

第四多种交付,支持多种公有云、SaaS、API服务、云上专属资源池、私有集群部署、超融合训推一体机等多种交付部署方案,并且持续升级和优化。

昇腾AI支撑紫东太初 “又快又好”

当AI大模型成为推动AI能力提升的重要工具和手段,其非线性甚至几何式高速增长的参数数量,导致AI大模型、巨量模型的计算规模越来越大,需要的硬件资源(NPU等)越来越多,对算力的需求极其巨大,一般的算力基础设施很快将难以胜任。建立以AI芯片为主的高效率、低成本、大规模的智能算力基础设施将成为训练AI大模型的前提。

强大的算力支撑对于大模型格外重要,因此紫东太初大模型建设初期就开始与华为合作,打造能够支撑国产大模型的算力底座。如今, “紫东太初”2.0以昇腾AI硬件及昇思MindSpore AI框架为基础,在AI算力与基础软件方面已经能够媲美外国顶尖厂商,满足国内人工智能千行百业的客户需求。

值得注意的是,紫东太初除了强大算法,也非常注重国产大模型生态方面的建设,推动国产基础软硬件与大模型技术的适配,协同构建我国通用人工智能自主创新发展生态。

当然,整个国产自主创新生态建设过程中并不是一蹴而就,生态建设需要一个循序渐进的过程。在这个过程中也面临着多方面挑战,例如生态建设需要很多个研发人员和开发者参与;新的算法也需要不断的开发、适配;还有就是各行业都有各自的特征,要针对不同模型进行研究等等。

构建自主创新的算力平台,是在智能化时代竞争取胜的关键。长期以来,华为在构建自主创新算力平台方面一直不遗余力,昇腾AI算力平台持续突破规模算力瓶颈。如今基于昇腾AI打造的人工智能计算中心已经从武汉人工智能计算中心、鹏城实验室等,规模化复制到全国二十多个城市。

同时昇腾AI与产业界共同构建了从规划、开发到产业化的大模型全流程使能体系,共筑中国大模型生态,当前基于昇腾AI基础软硬件平台已孵化和适配了30多个主流大模型,为中国人工智能产业繁荣提供一个强健、稳固的基石,使能“百模千态”,加速千行百业走向智能化。

赋能产业发展,昇腾AI+大模型打造智能底座

目前,“紫东太初”大模型已展现出广阔的产业应用前景,在神经外科手术导航、短视频内容摘要、法律咨询、医疗多模态鉴别诊断、交通图像研读等领域开始了一系列引领性、示范性应用。

其中,在医疗领域,基于紫东太初大模型开放服务平台,实现数据智能标注、高效模型训练、模型灵活部署,实现骨科器械/耗材的自动识别和清点,实现智能化、精细化管理,效率相比传统方式提升了6倍,准确率高达97%以上。

在智慧物流领域,基于“紫东太初”联合湖北港口着力构建多模态数据融合、极强泛化能力、业务高效协同的全省供应链通用人工智能底座。

在法律咨询行业,“紫东太初”大模型仅用0.546秒就可对法律案件进行拆解、提取关键事件,在办公效率方面实现案件分析速度的百倍提升,可有效解决律师整体资源匮乏、服务成本高等问题。

这些成果背后,与昇腾Al有着千丝万缕的联系。

昇腾AI始终积极布局,从底层软硬件核心技术,到行业应用商业规模使用,不仅为产业提供了坚实的人工智能计算底座,更是加速了数字化转型,为数字经济的建设注入源源不断的活力。

如今,昇腾AI产业正在蓬勃发展中,携手多家合作伙伴在金融、互联网、运营商等多领域打造2500多个AI解决方案,提供软硬件支持,开放AI模组、加速卡,推出形式多样的接口开发文档和参考设计,加速助推市场创新。此外,华为也将持续提升AI赋能,推动产业生态快速发展,助力人工智能与各行各业深度融合,为行业创造新价值,为行业智能升级提供新动能,开启人工智能新时代。

可以说,利用昇腾AI迸发强劲动能,将为人工智能产业繁荣发展构建起一个强健、稳固的基石,与各行各业碰撞出智慧的火花,加速人工智能在各行各业走深向实,共建计算产业,共创数智未来。

总结

如今,“紫东太初”大模型为基础,持续探索与类脑智能、博弈智能等技术路径的相互融合,推动了我国各行业的数字化转型。伴随大模型带来的生成式AI突破,人工智能正进入一个新时代。华为将积极完善软件平台和生态,让“百模”在昇腾的算力底座上加速创新,实现与行业伙伴一起创新突破,为数字经济的高质量发展、为人类社会进步贡献力量。

上一篇
下一篇