> 财商

Amazon Bedrock AgentCore重磅更新:助力企业构建具有更广阔知识和持续学习能力的Agent

2026-06-18 来源:亚马逊云科技

北京2026年6月18日 美通社 -- 亚马逊云科技宣布,专注于Agent构建、连接与优化的一站式平台Amazon Bedrock AgentCore推出多项新功能,助力企业加速构建拥有更广阔知识和持续学习能力的Agent。这些新功能将能够打通Agent与企业内部知识、公开网络知识及付费知识资源的连接通道,助力技术团队快速定位并修复生产环境中的故障问题,并搭建随Agent能力提升同步扩展的管控体系。

驱动当今Agent的模型非常强大。它们能够跨越复杂问题进行推理,规划多步骤工作流,并生成精准细腻的响应。但大多数Agent的实际表现远未达到这一潜力上限。差距不在于智能,而在于获取正确的上下文和反馈。

负责解答企业退款政策问题的客服类Agent,若无法访问SharePoint中存储的政策文档,便无法提供有效支持;撰写市场简报的研究类Agent,若无法获取训练数据之外的实时信息,输出的内容便会存在缺失;财务顾问类Agent,若无法突破付费墙获取所需的实时市场数据,只能给出次优建议。而在所有场景下,多数团队都缺乏系统化的方法,无法追踪Agent部署后的效果优劣变化。

能力强大的模型仅仅是起点。让Agent在生产环境中发挥效能的关键,在于使其能够获取完成全部工作所需的一切:正确的知识、执行操作的资源以及持续改进的反馈闭环。

知识更丰富、触达更广泛的Agent

Amazon Bedrock AgentCore上的Agent现已获得对三层知识的原生访问权限,每层知识都拓宽了Agent可以触达和完成的范围, 包括由AgentCore托管的企业知识层、公共知识层以及付费知识层。

企业知识层:Amazon Bedrock Managed Knowledge Base

企业最有价值的信息散布在类似SharePoint、Google Drive、Confluence、Amazon S3和内部维基中。传统方式下,要让Agent能够使用这些信息,需要搭建定制化的数据接入管道、调优检索效果,并长期维护数据的时效性。往往需要耗费数月的工程开发工作,Agent才能回答与企业自身业务相关的基础问题。

目前已在AgentCore上线的Amazon Bedrock Managed Knowledge Base(托管知识库),可以替代上述工作。企业只需接入自身的非结构化数据源,其余工作都由AgentCore处理。平台管理向量存储、检索期间使用的嵌入和重排模型,以及速率限制等扩展性问题,因此团队可以专注于构建Agent,而不是运营数据管道。该功能的核心是一个远超传统检索增强生成(RAG)的Agentic检索器。它不是将查询与最接近的文本片段做匹配,而是跨企业的知识库规划查询,连接各个文档中的相关概念,评估中间结果,并在回答之前进行重新排序。对于同时涉及多个主题的复杂多意图查询,Agentic检索的信息覆盖广度与完整度,明显优于基础检索方式。

无需构建管道,也无需调优检索,Agent就能从“无法访问”转变为基于实际业务知识来提供综合性回答。

公共知识层:Amazon Bedrock AgentCore上的Web Search(网页搜索功能)

内部知识存在局限性。法规不断更新,市场持续变化,竞争对手也在不断推出新产品。要让Agent发挥最佳作用,就需要掌握企业外部的实时动态,以支撑研究、事实核查、客户服务、市场情报分析等工作。现在,亚马逊云科技为构建AI Agent的开发人员推出了Web Search这一新工具。它提供来自网络的信息,同时将数据保留在客户安全的亚马逊云科技环境中。

Web Search基于亚马逊云科技统一的搜索基础设施构建,该架构同时支撑AIexa+、Amazon Quick Suite与Kiro等产品;它针对Agentic检索进行了优化,返回的高价值摘录具有极高的单位Token智能密度。它还采用了多源事实锚定方案,将公共网络信息与亚马逊云科技专有的知识图谱相结合。该图谱融合了结构化的实体数据、经过验证的事实以及例如像股票价格和体育比分等实时信息。

Web Search将用户的查询保留在亚马逊云科技安全和合规边界内,无需引入额外的供应商,也没有随之而来的编排、身份验证或计费工作流。无论企业是在构建交叉引用公共来源的研究Agent,监控法规和政策更新的合规Agent,还是利用最新信息锚定模型响应,Agent现在都可以像查询内部知识一样对实时网络信息进行推理。

索尼集团公司高级总经理Masahiro Oba表示:“在索尼,我们正在Amazon Bedrock AgentCore上构建企业级AI Agent平台,让各业务部门的团队都能够开发、共享和复用针对其自身需求量身定制的AI Agent,涵盖从知识助手到工作流自动化的各类代理。我们的企业知识分布在SharePoint、Confluence和Amazon S3等各类存储库中,其中包含PDF、演示文稿以及带有图表和表格的电子表格等复杂文档。随着Knowledge Base与Web Search在Amazon Bedrock AgentCore中正式推出,我们现在无需从头构建这些功能,就能在统一的治理模型下,为智能代理配备先进的检索与实时网络事实锚定能力。这有力地加速了我们的愿景以AI为催化剂,在大规模应用中彻底改变人们的工作方式。”

付费知识层:AgentCore支付与Amazon WAF AI流量变现

最好的信息并不总是免费的,例如:金融市场动态、许可研究、专有数据集、付费API。如果Agent无法访问付费资源,它将返回次优的答案,而用户永远不知道错过了什么。

访问付费内容需要两个部分:Agent端需要支付能力,而提供商端则需要收款机制。上个月推出的Amazon Bedrock AgentCore支付功能(预览版)处理了Agent端的需求,让Agent能够在执行闭环中发现付费服务和内容、访问它们并进行支付。现在,正式可用的Amazon WAF AI流量变现功能则处理了提供商端的需求,使内容所有者能够控制Agent访问:可以选择屏蔽、放行或收费。由于这两种功能都在同一个平台上运行,使用Amazon WAF的提供商会自动识别在Amazon Bedrock AgentCore上验证的Agent。最终形成一个可信通道:经验证的Agent享有更低的接入摩擦,内容提供方则获得相应报酬。这两项能力共同构建了Agent经济双边基础设施,让Agent能够触达所有信息而不仅仅是那些恰好免费的内容。

从每次交互中学习的Agent

提升Agent的知识获取能力只是问题的一方面。企业还需要了解Agent是否真正达成了目标,并在表现不佳时及时发现问题。

这听起来容易做起来难。最危险的Agent故障不是那些抛出错误的故障,而是那些在仪表盘上看起来正常的故障:一个确认了从未执行过的订单修改的Agent,一个在API超时时虚构产品可用性的Agent,或者另一个跳过了审批步骤但在仪表盘上显示99%成功率的Agent。这些故障不会产生错误信号。它们在几周后通过客户投诉暴露出来,此时通常已经影响了数千个会话。即便团队察觉到存在问题,修复工作也大多依赖猜测:调整提示词、修改工具描述、微调编排逻辑,最后只能寄希望于改动有效,没有系统化的方法可以验证改动是否真的优化了效果,或是悄悄引发了其他问题。

现在,亚马逊云科技宣布了Amazon Bedrock AgentCore中推出全新的优化功能,将生产追踪转化为持续改进。它们共同形成了一个闭环:理解Agent的实际行为,生成基于数据的修复方案,在发布前对其进行验证,并证明其有效性。

理解Agent的行为:Insight洞察功能现已提供预览版,AgentCore可在数百个会话中提供丰富的故障、意图和轨迹洞察,暴露出任何仪表盘或逐个追踪审查都无法发现的模式。故障洞察可以发现循环往复的故障模式,包括不产生错误信号的隐蔽行为故障,详细解释每个故障的根本原因,并根据受影响的广泛程度进行排序,从而使人能一眼看出哪些问题对用户的伤害最大并优先予以修复。意图洞察可以根据用户的实际意图对请求进行聚类,从而能看到Agent被使用的真实形态。轨迹洞察对Agent完成任务所采取的路径进行分组,以便能够发现常见模式和异常值。可以通过每日或每周报告启用持续监控,或者在部署后或投诉激增时进行针对性调查,在几分钟内即可获得结果。

充满信心地修复:一旦知道要更改什么,正式可用的建议功能和AB测试功能将帮助团队采取行动。建议功能通过分析追踪和评估输出来提出针对系统提示词和工具描述的具体改进建议,这些建议基于Agent的实际行为。批量评估针对定义的测试数据集测试这些建议并报告总体得分,从而在更改进入生产环境之前捕获回归。AB测试通过分流实时生产流量,在Agent版本之间进行受控的对比,在最终确定采用前,提供更改在生产环境条件下有效的真实证据。无论Agent在哪里运行,所有这些都可以发挥作用:在Amazon Bedrock AgentCore的运行时、Amazon Lambda、Amazon EKS或非亚马逊云科技环境中。

FUJISOFTAI推广部高级经理Kazumi Matsuda表示:“在FUJISOFT,我们正在构建AI Agent以加速软件开发和运营。我们的框架Character Capsule将Agent角色、技能和程序打包为可重用的胶囊,既可在Copilot和Kiro等本地编码工具上运行,也可扩展到Amazon Bedrock AgentCore上进行多Agent编排。随着我们部署更多Agent,我们面临的最大挑战是那些看起来不错但随后浮出水面的隐性故障,修复它们只能靠猜测。Amazon Bedrock AgentCore中的优化功能改变了这一点。它们分析我们的生产追踪以揭示故障模式,解释它们发生的原因,并按影响对它们进行排序。然后我们会得到改进提示词和工具描述的建议,并在提交之前在实时流量上对它们进行AB测试。Agent改进现在是一个建立在数据基础上的持续循环,而不是反复试验。”

随着Agent能力增强,管控也需同步升级:全新策略增强功能

能力越强的Agent意味着越大的攻击面。而且Agent带来了传统软件从未有过的安全挑战:它们是概率性的。Agent会做出判断,而判断可以被上下文所影响。新的风险暴露点不再是网络,而是Agent的上下文,提示词注入和记忆投毒不需要入侵系统,只需要说服agent做出一个错误判断。

安全保障概率性事物的方法是使用确定性的事物:不是作为大脑,而是作为它周围的护栏。Amazon Bedrock AgentCore中的Policy策略功能已经在网关处提供了实时的确定性控制,定义了Agent可以使用企业的工具和数据做什么或不能做什么。现在,亚马逊云科技通过Amazon Bedrock Guardrails集成扩展了这些功能,并已正式可用,它会评估每个Agent操作以防止提示词注入尝试、有害内容和敏感数据暴露。这些检查在网关层运行,在Agent代码之外,Agent无法在其上下文中看到它们,无法绕过它们进行推理,也无法说服自己它们不适用。

Guardrails是策略引擎可采取行动的众多检测信号中的第一个,并且它将不仅仅是平台自有的信号。近期,AgentCore将允许将来自领先安全提供商(包括CheckPoint、Zscaler、Rubrik、Netskope和SentinelOne)的检测信号输入到相同的策略中。无论信号来自何处,原则都保持一致:检测可以是概率性的,但策略执行始终是确定性的,即基于既定阈值做出最终的允许或拒绝决定。

由于Amazon Bedrock AgentCore上的每个工具和上下文源都通过网关路由,因此Agent获得的新功能会自动受到同一安全层的约束。更强大的Agent,更严格的控制,两者同步扩展。

几分钟内从想法到运行中的AgentAmazon Bedrock AgentCore harness运行环境正式可用

Agent不仅仅是一个模型。如果模型是大脑,那么Harness运行环境就是身体:大脑完成工作所需的一切。它运行编排闭环、执行工具、管理上下文窗口、跨轮次持久化状态、从故障中恢复并隔离每个会话。Harness对Agent性能表现的影响与模型同样重要。构建一个耐用的Harness是目前大多数团队花费时间最多的地方。

现已正式可用的Amazon Bedrock AgentCore harness为企业提供了运行环境层的托管功能。无需为整个运行流程编写代码,而是通过配置来定义Agent:其使用的模型、调用的工具、可以访问的技能以及遵循的指令。AgentCore会动态组装并驱动这一执行流程。通过该单一配置,企业可以在几分钟内获得一个在自身隔离环境中运行的、可工作的Agent。它配备了文件系统和Shell、跨会话的记忆、Skills(包含亚马逊云科技官方精选的Skills目录),以及网页浏览功能。这并不是一个会随着业务规模扩大而淘汰的初学者工具:开始时使用的配置就是大规模运营时使用的配置,当需要自定义编排时,可以将Harness导出为代码并保持在相同的平台上,而无需重新构建任何内容。

除了速度,它真正释放的是市场上尚不存在的选择自由。当前可用的Harness方案都会让企业被绑定在某个环节:开源方案需要自行托管和运维Harness;托管服务会将企业锁定在它们的环境中;模型厂商提供的Harness则只针对自家模型做了优化。而亚马逊云科技将Harness与模型解耦,让企业可以选择任意模型,甚至在会话中途切换,而无需改动Agent逻辑。当前沿技术不断推进、最适合某项任务的模型发生变化时,企业的Agent基础架构岿然不动。

选择只是一部分。由于Harness是单一平台的一个组成部分,而不是包裹在框架周围的托管层,因此它在调用工具时,都会通过同一个网关进行路由该网关不仅强力执行安全策略,同时也将Agent连接至企业知识、网络通识和付费知识。身份、记忆和可观测性都来自这同一个平台,因此Agent采取的每项操作都从第一次调用开始受到治理和追踪,无需额外的线路连接。企业在第一天声明的Agent就是第一千天运行的Agent,自始至终建立在相同的基础之上。

Twilio产品副总裁Omar Paul表示:“Twilio的客户正在构建跨越语音、消息传递和数字渠道的AI Agent,具有实时智能和持久记忆,使每次交互感觉都像是在对话。通过将Amazon Bedrock AgentCore harness与Twilio Conversations相结合,开发人员可以从构思直接过渡到实时Agent,而无需重新搭建基础设施。当出色的AI和出色的通信基础设施一起构建时,就能带来最佳的客户体验。”

开始使用

Harness运行环境托管功能、Managed Knowledge Base功能、Web Search功能、Guardrails集成功能、建议和AB测试功能,均已在Amazon Bedrock AgentCore上正式可用,同时Insights洞察功能和支付功能也已推出预览版。用户可以通过控制台或AgentCore CLI开始使用上述新功能,更多详情请访问官方文档

回到顶部