Agent落地企业级场景:亚马逊云科技的布局与探索
2025年,亚马逊云科技在云服务市场成绩斐然,年收入超1320亿美元,同比增长20%。在此基础上,其在AI领域积极布局,从基础设施到应用层面均有动作,尤其是在企业级Agent场景推出一系列的产品。
2025年年底,在北京举办了亚马逊云科技re:Invent中国行北京站的活动,亚马逊云科技大中华区产品部总经理陈晓建和大中华区产品技术总监王晓野参与活动,分享了其最新进展。
AI基础设施与芯片
亚马逊云科技与NVIDIA保持超15年合作,2025年推出的搭载NVIDIA最新GB300 NVL72系统的Amazon EC2 P6E GB300实例,为特定AI工作负载提供计算能力。
Amazon AI Factories作为私有亚马逊云科技区域,允许客户利用自身数据中心和电力容量,搭建含最新NVIDIA GPU、自研Amazon Trainium芯片、Amazon SageMaker AI训练推理平台及Amazon Bedrock模型服务平台的先进AI基础设施,满足合规等要求。
对于Amazon Trainium芯片,陈晓建提到:“它已经成为业界具有性价比的训练和推理芯片,Claude模型100%在Amazon Trainium上运行。此次推出的Amazon Trainium3 UltraServer服务器中,芯片全部由亚马逊云科技自研,包括Amazon Nitro、Amazon Graviton以及Amazon Trainium。”
目前,Amazon Trainium已部署超100万片,部署速度比前沿AI芯片快四倍。据了解,下一代芯片Amazon Trainium3及规划中的Amazon Trainium4,将在计算性能、内存带宽等多方面实现提升。
推理平台与模型
Amazon Bedrock是目前全球领先的模型推理平台,帮助生成式AI应用从原型走向生产,并提供模型、定制能力及安全保障。
近期,亚马逊云科技又推出了18个开放权重模型,包括国际知名及中国头部模型开发商的产品。同时,其自研的Nova模型家族推出Nova 2各版本:Nova 2 Lite高效经济,适用于日常工作负载;Nova 2 Pro适合复杂工作场景;Nova 2 Sonic专注语音领域;Nova 2 Omni具备跨模态能力,可处理文本、图像等多种信息,并实现图像生成与编辑。
在被问到Amazon Bedrock以及Amazon SageMaker AI中推出的模型定制功能时,陈晓建介绍:“我们主要提供三种不同的能力。第一种是通过Amazon Bedrock进行模型微调的能力。它的特点是使用者不需要具备专业的机器学习能力,即使是不具备算法背景的IT人员也能操作。用户只需在Amazon Bedrock中选择合适的模型,并将其与调优日志打通。通过上传数据集并定义一个评估函数,告知模型什么样的结果是好的,Amazon Bedrock就会自动完成端到端的所有工作。这种模型微调工作我们称之为强化微调(RFT)。使用RFT后,定制后的模型相比基础模型,平均可获得66%的准确率提升。这主要针对不具备AI训练专业能力的场景。
第二种是Amazon SageMaker AI提供的无服务器化模型定制功能。这种功能更成熟,可以完成类似于RLHF(人类反馈强化学习)、RLAIF(AI强化学习)以及DPO(直接偏好优化)等任务。它有两种模式:第一种是完全自动化的模式,与Amazon Bedrock类似,可以通过自然语言描述诉求,引导系统自动完成从数据合成到模型评估的工作;第二种是自助引导模式,为用户提供更多的控制权。这两种模式都是无服务器化(Serverless)的,用户不需要管理底层的GPU服务器、网络架构或存储,这些都由Amazon SageMaker AI自动完成。
第三种是我们推出的‘开放式训练’路径,也就是Nova Forge。这与前两种模式不同,用户可以在Nova模型训练的环节就注入自己的数据。Swami打过一个贴切的比喻:人类在12岁之前学语言能达到母语水准,12岁以后就很难了。模型微调也面临类似的两难困境,后期注入数据可能会让模型忘记之前训练时达到的智能。Nova Forge允许用户将Nova作为基础模型,在训练环节选择检查点,将业务数据作为训练的一部分注入,从而获得更好的效果。一个典型的客户案例是Reddit。作为一个内容网站,Reddit曾尝试过各种模型微调和商业化模型,但都很难达到预期效果。最终他们通过Nova Forge环境实现了效果与成本的双重目标。目前Nova Forge仍处于早期阶段,已经有多个客户表示感兴趣。”
Agent构建、应用及前沿探索
作为2025年的热词,Agent被反复提起。Amazon Bedrock AgentCore被用于Agent构建,陈晓建在谈到Amazon Bedrock AgentCore的能力定位时说:“它是为了解决各行各业在开发Agent时遇到的通用挑战。挑战之一是调优模型;之二是构建Agentic AI的后台业务架构,这与传统的云架构有很大不同。”
据他介绍,开发Amazon Bedrock AgentCore背后有两个原因。第一,它满足了开发Agentic AI workload时的通用需求,为客户屏蔽底层复杂性,减少开发工作量。例如几乎每个人都需要Memory(上下文管理),以及Runtime(为每个会话创建安全独立的运行环境),这些能力通过Amazon Lambda的microVM技术解决了。第二,展现了亚马逊云科技作为一流云服务商,通过20年开发所积累的丰富底层核心能力,并通过Amazon Bedrock AgentCore将这些差异化能力透传给客户。
王晓野补充道:“虽然Agent这个词听起来没变,但技术原理与去年有很大不同。去年大家容易把assistant和Agent的概念混淆。但今年我们发布的能力代表Agent能够主动思考。当结果错误时,它会自我反思并形成循环,从接收指令到执行任务、调用系统操作,如果出错就反思重来。这正是Amazon Bedrock AgentCore提供给开发者构建Agent的逻辑。”
Amazon Bedrock AgentCore具备七种能力,涵盖设定上下文记忆、配置身份权限、执行代码分析风险、提供安全运行环境及实现可观测性监控等,目前,有众多不同行业的用户正在使用。
为规范Agent执行,亚马逊云科技在上述七种能力模块基础上,还推出了Policy in Amazon Bedrock AgentCore,通过Cedar语言在智能体与工具间监督执行,以及Amazon Bedrock AgentCore Evaluations。王晓野表示:“Amazon Bedrock AgentCore这次发布的几个重要功能,包括Policy和Evaluations,它们有一个共性,就是让Agent具备Trust(可信赖)和Reliable(可靠)的特质,从而进入更严肃的应用场景。我们通过Automated Reasoning(自动推理技术)这种传统数学推理方式,在模型之外由另一套方法控制Agent的输出是否正确。”
同时,Amazon Bedrock AgentCore Evaluations还预设了13个评估器,用于评估Agent输出质量,保障开发与运行阶段的质量。
在亚马逊内部应用方面,Amazon Quick作为面向场景的消费级AI体验产品,整合多种数据源,通过多功能及多Agent协作提升工作效率,如税务团队借此实现税务数据处理自动化。Amazon Connect作为呼叫中心服务,增加八种新的Agentic AI功能,提升客户服务体验,吸引丰田等企业使用。
亚马逊云科技还推出了Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent三款前沿Agent,适用于特定场景。“Kiro自主Agent就是一个高度智能化的编程助手。它采用Spec - Driven Programming(规格驱动编程),通过人的指令逐步分解并自动化完成任务,同时能与人交互并接受建议,最终达成目标。”陈晓建说。
在谈及Agent大规模落地挑战时,陈晓建指出:“很多客户遇到的挑战在于,POC(原型验证)阶段效果很好,但一上生产环境就大打折扣。这背后有两个核心原因:一是数据质量。POC阶段的数据往往是经过筛选、可控的,而生产环境下的真实数据质量通常远低于预期,这对最终结果影响极大。
关于传统云厂商在Agentic AI时代的价值,我认为不仅存在,而且更加重要。在真实的生产环境下,企业依然要面对复杂的后台架构挑战。首先是安全。我们投入大量精力开发Policy in Amazon Bedrock AgentCore,就是为了保证Agent严格在公司策略和预设框架内执行。如果无法控制Agent的行为(例如涉及大额退款的场景),没有企业敢真正让它上线。
其次是数据安全和个人隐私保护,这在对外提供服务时至关重要。此外,性能、成本、可伸缩性和高可用性等,都是上生产时必须一一攻克的难题。这些能力并非随Agentic AI突然出现,而是云厂商多年深耕所积累的核心优势。”
在采访最后,王晓野预测:“2026年,Agent将从相对简单的场景迈向更多严肃的企业级场景,安全性及可靠性更高的应用将变得更多。”
本文 原创,转载保留链接!网址:https://licai.bangqike.com/cjnews/1320195.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

