生成式AI格局风云再起,亚马逊云科技投资Anthropic 40亿美元后,强势官宣五项生成式AI创新
随着算力和模型规模的发展,多模态大模型迎来了“涌现”。在此基础上,生成式AI成为大模型落地的典型,帮助人类高效创建新的内容和创意。生成式AI由机器学习模型提供支持,企业和个人均可以基于开源的根基模型进行再训练,来创建出适合自身需求的特点的模型和应用。在这个过程中,再训练所需的算力基础设施,以及尝试多个开源模型,都需要不菲的投入。“云服务”的低门槛、易部署的特点,是否可以在企业的AI之路再现?
○ 亚马逊云科技全托管生成式 AI 服务 Amazon Bedrock 现已正式可用。客户可以使用来自众多领先 AI 公司的高性能基础模型,以及构建生成式 AI 应用程序所需的一系列功能,在简化开发过程的同时确保隐私和安全;
○ Amazon Bedrock 新增 Amazon Titan Embeddings 和 Meta Llama 2 模型,为客户寻找适合其应用场景的模型提供更多灵活选择;
○ 全新 Amazon CodeWhisperer 功能将提供定制的、基于生成式 AI 的代码建议,充分利用企业内部代码库,提升开发者生产效率;
○ Amazon QuickSight 提供生成式 BI 仪表盘创作功能,使业务分析师能够更加方便快捷的探索数据,并使用自然语言描述便可创建可视化报告;
○ 阿迪达斯、宝马集团、GoDaddy、默克、国民西敏寺银行集团(NatWest Group)、Persistent、美巡赛(PGA TOUR)、株式会社竹中工务店(Takenaka Corporation)和 Traeger Grills 等公司都在应用来自亚马逊云科技的生成式 AI 创新重塑其产品和服务。
亚马逊云科技宣布推出五项生成式 AI 创新,使各种规模的企业都可以构建新的生成式 AI 应用程序,提高员工生产力并完成业务转型。这五项创新包括:亚马逊云科技全面托管服务 Amazon Bedrock 正式可用,通过统一的应用程序编程接口(API)提供来自领先 AI 公司的基础模型(FM);亚马逊云科技宣布 Amazon Titan Embeddings 模型正式可用,为客户提供更多基础模型选择;Amazon Bedrock 最新引入了 Meta Llama 2 模型,这是第一个通过 API 提供完全托管 Meta Llama 2 模型的服务;AI 编程助手 Amazon CodeWhisperer 的新功能即将提供预览,可以根据企业的内部代码库安全地定制 CodeWhisperer 的代码建议,助力开发人员从生成式 AI 中获得更大价值;Amazon QuickSight 的生成式 BI 创作功能现已推出预览版,可以提高业务分析师的工作效率。这一功能是云原生构建的统一 BI 服务,使客户能够通过自然语言简单地描述他们想要的内容,从而创建可视化内容、格式化图表、执行计算等。从 Amazon Bedrock、Amazon Titan Embeddings,再到 Amazon CodeWhisperer 和 Amazon QuickSight,这些创新增强了亚马逊云科技在生成式 AI 堆栈各个层面的能力,无论任何规模的企业都可在获得企业级安全和隐私保护的同时,选择模型并进行模型定制。
“在过去的一年里,海量数据的爆炸、大规模弹性算力的就位,以及机器学习技术的快速进步点燃了人们对生成式 AI 的热情,深刻改变了各行各业,并重塑了人们的工作方式。”亚马逊云科技数据和机器学习全球副总裁 Swami Sivasubramanian 表示,“凭借企业级的安全和隐私保护、领先的基础模型选择、数据为先的方法论,以及高性能、具有成本效益的基础架构,亚马逊云科技赢得了企业的信赖,并在技术栈的每一层使用生成式 AI 解决方案助力企业不断创新。这次的发布是一个重要的里程碑,它将生成式 AI 提供给每个企业,从初创企业到大型企业的每个员工,从开发工程师到数据分析师。通过强大的创新,亚马逊云科技为企业带来了更强的安全性、多种选择和出色的性能,同时还帮助它们紧密对齐企业的数据战略,进而能够充分释放生成式 AI 的潜力。”
各行各业的企业无论规模大小,都渴望借助生成式 AI 来变革运营方式,重新思考解决复杂问题的方法,并创造全新的用户体验。尽管生成式 AI 的最新进展引起了广泛关注,但许多企业还未能参与到这一转型过程中。它们一边对使用生成式 AI 充满渴望,一边又对这些工具的安全性和隐私问题忧心忡忡。这些企业希望能够测试多种基础模型,从而找到最适合自己应用场景的模型。它们还希望最大限度地利用已经拥有的数据,通过定制模型来为最终用户提供独特的体验。最后,企业需要工具将创新迅速推向市场,还需要具备在全球范围内部署生成式 AI 应用程序的基础设施。
这就是为什么众多企业正在向亚马逊云科技寻求生成式AI服务,比如阿迪达斯、Alida、宝马集团、Genesys、Glide、GoDaddy、Intuit、律商联讯(LexisNexis Legal & Professional)、孤独星球(Lonely Planet)、默克、国民西敏、Perplexity AI、Persistent、Quext、RareJob Technologies、Rocket Mortgage、SnapLogic、株式会社竹中工务店、Traeger Grills、美巡赛、Verint、Verisk 和 WPS 等。
Amazon Bedrock 正式可用,帮助更多客户构建和扩展生成式 AI 应用程序
Amazon Bedrock 是一项完全托管的服务,提供了来自众多领先 AI 公司(包括 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊)面向海外业务的的高性能基础模型,以及企业构建生成式 AI 应用程序所需的一系列功能,能够在实现简化开发的同时确保隐私性和安全性。基础模型具有良好的适用性,可为信息搜索、内容创建及药物发现等诸多领域提供支持。但是对于许多希望利用生成式 AI 的企业来说,尚有一些问题需要解决。首先,它们需要简单直观的选取和访问高性能基础模型,满足其场景需求且表现优异;其次,客户希望应用程序实现无缝集成,无需管理庞大的基础设施集群或花费大量成本;最后,客户希望借助基础模型并结合自身数据来轻松构建差异化的应用程序,而这些客户用于定制的数据无疑是非常宝贵的资产,具有知识产权,因此在使用过程中必须做到全面保护,在确保安全和隐私的同时,保证客户对数据共享和使用方式拥有控制权。
借助 Amazon Bedrock 的完善功能,企业能够更方便、轻松地尝试多种领先的基础模型,使用自己的专有数据定制模型。此外,Amazon Bedrock 还提供差异化能力,例如无需再编写任何代码便可创建的托管代理(AI agent),它可以执行复杂任务,如旅行预订、处理保险索赔、策划广告活动和管理库存等。由于 Amazon Bedrock 采用无服务器(serverless)技术,客户不必管理任何基础设施,就可以使用已经熟悉的亚马逊云科技服务将生成式 AI 能力安全地集成和部署到应用程序中。
Amazon Bedrock 在开发之初就考虑到安全性和隐私保护,帮助客户保护敏感数据。客户可以使用 Amazon PrivateLink,在Amazon Bedrock与虚拟私有网络(VPC)之间建立专门的安全连接,确保任何数据传输都不会暴露在公共网络。对于存在高度监管需求的客户,Amazon Bedrock 符合 HIPAA(《健康保险流通与责任法案》)要求,并且可以在 GDPR(欧盟《通用数据保护条例》)合规标准下使用,让更多的客户从生成式 AI 中获益。
Amazon Bedrock通过 Amazon Titan Embeddings 和 Llama 2 进一步扩大可选模型范围,帮助每个客户找到适合应用场景的模型
事实上,没有任何一个单一模型可以适用于所有的应用场景。因此,为了挖掘生成式 AI 的价值,企业往往需要访问多个模型,根据自己的要求寻找最适合的那一个。为此,Amazon Bedrock 让出海客户只需通过单一 API 就能找到和测试 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊提供的领先的基础模型。此外,亚马逊云科技近日还宣布了 Anthropic 未来的所有基础模型都将在 Amazon Bedrock 上可用,并为亚马逊云科技出海客户提供模型定制和微调等特殊功能的优先访问。而现在起,Amazon Bedrock 再次引入新的基础模型带来更多选择:
Amazon Titan Embeddings 现正式可用:Amazon Titan 基础模型是由亚马逊云科技在大型数据集上创建和预训练的一系列模型,可以支持各种应用场景。作为这些模型中第一个正式可用的模型,Amazon Titan Embeddings 是一种大语言模型(LLM),它将文本转换成被称为嵌入向量(embeddings)的数值表示,以支持检索增强生成(RAG)的应用场景。基础模型虽然适用于多种任务,但却只能根据从训练数据和提示词上下文中学到的信息来回答问题。一旦这些回答需要利用高时效性的知识或专有数据时,其有效性就会受限。为了能通过扩展数据来改进基础模型的回答,许多企业将目光转向 RAG ——这一流行的模型定制技术能将基础模型连接到可被引用的知识库,从而改进响应效果。要开始使用 RAG,客户必须先访问一个嵌入模型,将数据转换成嵌入向量,使基础模型更容易理解数据之间的语义和关系。然而,构建嵌入模型需要大量的数据和资源,以及深厚的机器学习专业知识,因此很多客户很难完成自行构建,也就无法实现 RAG。Amazon Titan Embeddings 使客户能够更简单地启用 RAG,以便利用专有数据扩展各种基础模型的能力。Amazon Titan Embeddings 支持超过25种语言和多达8192个 token 的上下文长度,非常适合基于企业的应用场景处理单个单词、短语或整个文档。该模型可返回1536个维度的输出向量,确保高度准确性的同时还专为实现更低延迟和更优性价比进行了优化。
Llama 2 即将在未来几周推出:Amazon Bedrock 是业界首个通过托管 API 提供 Meta 下一代大语言模型 Llama 2 的完全托管的生成式 AI 服务。Llama 2 模型比之前的 Llama 模型有了显著改进,包括使用了比原始训练多40%的训练数据,并具有更长的上下文长度(4000个 token),以处理更大的文档。Amazon Bedrock 提供的 Llama 2 模型已经过优化,可以在亚马逊云科技基础设施上提供快速响应,非常适合对话式应用场景。客户可以构建由130亿和700亿个参数的 Llama 2 模型驱动的生成式 AI 应用程序,且无需设置和管理任何基础设施。
AmazonCodeWhisperer 新功能将允许客户使用私有代码库安全地定制 CodeWhisperer 代码建议,进一步提升开发人员效率
Amazon CodeWhisperer 是一款基于 AI 的编程助手,它通过对数十亿行来自亚马逊和公开可用的代码进行训练,提高开发人员的生产力。虽然开发人员在日常工作中频繁使用 CodeWhisperer,但有时他们需要将其企业内部私有代码库(例如内部 API、代码库、软件包和类)整合到应用程序中,而这些代码都不属于 CodeWhisperer 的训练数据。内部代码的使用也是一个难题,因为说明文档有限,并且没有开发人员可以求助的公共资源或论坛。
例如,要编写一个用于从购物车中移除商品的函数,开发人员必须首先了解用于与应用程序交互的 API、集合和其他内部代码。以前,开发人员可能需要花费数小时来检查以前编写的内部代码,从而找到所需信息并理解其工作原理。即使找到了正确的资源,他们仍需仔细检查代码,以确保其符合公司编码的最佳实践,并且不会重复引用代码中的任何缺陷或漏洞。
Amazon CodeWhisperer 新定制功能将解锁生成式 AI 编程的全部潜力,通过安全地利用客户的内部代码库和资源提供定制化建议。这使得开发人员在各种任务中能够更准确地获得代码建议,从而节省时间。首先,管理员需要从源(例如 GitLab 或 Amazon S3)连接到他们的私有代码存储库,并调度一个作业来创建自己的定制内容。在创建定制内容时,CodeWhisperer 利用各种模型和上下文定制技术,学习客户的代码库并改进实时代码建议,从而使开发人员花更少的时间去寻找无差别的问题的正确答案,同时将更多时间投入到创建新的差异化体验上。管理员可以在亚马逊云科技控制台(Amazon Console)集中管理所有定制功能、查看评估指标、估算每个定制功能的性能,并有选择地将它们部署给公司内特定的开发人员,以限制对敏感代码的访问。
通过选择高质量的存储库,管理员可以确保 CodeWhisperer 提供的定制建议不包含已弃用的代码,以满足企业质量与安全标准。考虑到企业级安全和隐私,这项功能可以确保定制内容完全私密,而支持 CodeWhisperer 的底层基础模型在训练过程中不使用定制内容,能够保护客户宝贵的知识产权。该自定义功能将很快作为 CodeWhisperer 企业版的一部分在预览中提供给客户使用。此外,CodeWhisperer 的自定义设置默认确保了安全性,无论客户使用 Amazon CodeWhisperer 专业版还是企业版,在处理来自开发人员 IDE 的请求时,亚马逊云科技均不会存储或记录任何客户内容。
Amazon QuickSight 的新生成式 BI 创作功能,可以帮助业务分析师使用自然语言命令轻松创建和定制数据可视化效果
Amazon QuickSight 是一个为云端构建的统一 BI 服务,能够创建交互式仪表盘、分页报告以及嵌入式分析,同时具备使用 QuickSight Q 进行自然语言查询的能力,因此企业的每位用户都能以他们偏好的格式获取所需的洞察。
通常情况下,商业分析师需要花费数小时使用 BI 工具来探索各种不同的数据源,添加计算、创建和完善可视化效果,然后将它们呈现在仪表盘中提供给业务利益相关者。要创建一个简单的图表,分析师首先必须找到正确的数据源、识别数据字段、设置过滤器,同时进行必要的个性化设置以实现良好的可视化效果。
如果进行数据可视化需要进行新的计算(例如年度销售额),分析师还必须确定所需的参考数据,然后创建、验证并将视觉效果添加到报告中。如果可以减少商业分析师手动创建和调整图表和计算所花费的时间,让他们将更多时间投入到高价值的任务中,企业也能从中获益。
新的生成式 BI 创作功能扩展了 QuickSight Q 的自然语言查询功能,使其不仅能够回答清晰表述的问题(例如,“加利福尼亚州销售排名前10的产品是什么?”),还能帮助分析师从问题片段(例如,“销售排名前10的产品”)快速创建可定制的视觉效果,通过提出后续问题来澄清查询意图,优化视觉效果,并完成复杂的计算。业务分析师只需描述想获得的结果,QuickSight 即可生成具有良好观感的视觉对象。分析师仅需简单操作就能将其轻松添加到仪表盘或报告中。
例如,分析师可以要求 QuickSight Q 为“2022年和2023年运动鞋销售额的月度趋势”创建可视化内容,该服务会自动选择合适的数据,并根据请求使用最合理的图表格式(比如线形图或条形图)绘制所需信息。QuickSight Q 还将提供预设的提示问题,帮助分析师澄清在多个数据字段与其匹配查询时可能出现的歧义(比如图表应包括运动鞋销售额的美元总额还是销售的单位个数)。
分析师获得了最初的可视化内容后,还可以使用自然语言添加复杂的计算,改变图表类型,或优化可视化效果。QuickSight Q 中新的生成式 BI 创作功能使业务分析师能够轻松快捷地创建良好的视觉效果,更快速地为大规模数据驱动型决策提供宝贵的信息依据。
千行百业的客户都在利用亚马逊云科技的生成式 AI 服务创建新的应用程序,提高开发人员的效率,以及帮助分析师更快速地获取洞察
阿迪达斯是全球最大的运动品牌之一。“我们很高兴能参与 Amazon Bedrock 预览版的试用,亲身体验这项服务。Amazon Bedrock 对我们的生成式 AI 工具构建大有裨益,Amazon Bedrock 承担了构建生成式 AI 应用的繁重基础设施管理工作,使我们能够专注于大语言模型项目的核心方面。”阿迪达斯企业架构副总裁 Daniel Eichten 表示,“我们已经使用 Amazon Bedrock 开发了一款生成式 AI 解决方案,使阿迪达斯的广大工程师只需通过单个对话界面,就能从知识库中找到所需的各种信息和答案,回答从入门到复杂的多种技术问题。”默克是一家研发密集型生物制药公司,130多年来一直致力于发现和研发创新药物和疫苗,以拯救生命和改善健康。“完整的制药价值链上存在很多手动且耗时的流程,这些流程阻碍了更有价值的工作的开展,同时还不能有效利用数据改善员工、客户和患者体验。”默克数据科学执行董事 Suman Giri表示,“借助 Amazon Bedrock,我们迅速建立了生成式 AI 功能,使知识挖掘和市场研究等工作更高效。在我们的美国患者分析工作流程中,我们可以利用这些功能提供对患者治疗的见解,提高生活质量,扩大商业影响力,同时填补数据共享方面的空白,为负责任的生成式 AI 打造数据治理生态系统。” 宝马集团是全球顶级的汽车和摩托车制造商之一。“宝马的区域专家致力于优化整条供应链的库存。他们经常收到董事会成员或供应链专家等利益相关者的请求,要求创建新的仪表盘视图,以便他们分析最新趋势。”宝马集团数据工程和分析专家 Christoph Albrecht 表示,“QuickSight Q 创作体验能够显著节省时间,可以在无需参考的情况下创建计算、快速构建视觉效果,然后通过自然语言对可视化呈现进行精确调整。区域专家的快速反馈给我们的业务用户留下了深刻印象,从而让他们可以更快地做出重要决策。”
总结
通过亚马逊云科技全托管生成式AI服务,使得任何规模企业都可以敏捷构建基础设施,灵活选择模型,并快速开始定制,助力企业深入挖掘数据价值,赋能业务创新。
END