亚马逊把Agent从原型变成产品:Bedrock AgentCore GA的真正意义,以及AWS的平台战争下一步
2026年6月18日,AWS Machine Learning Blog上线了一篇由Kosti Vasilakakis、Alexander Richey、Evandro Franco和Vivek Dalal联署的技术文章。标题平淡:Amazon Bedrock AgentCore Harness is now generally available。但这个GA公告背后压缩着一个在云计算史上反复出现的剧本——当一项技术从”有趣的实验”变成”可计费的基础设施”,战场的性质就彻底改变了。
同一天,Anthropic发布了Project Fetch Phase 2研究报告,记录了Claude在无任何人工辅助下完成商业四足机器人控制任务的全过程,速度比无Claude的人类团队快37倍(来源:Anthropic Research, 2026-06-18)。这不是巧合的时间节点碰撞——这是两家公司对”Agent能做什么”的不同诠释方式:Anthropic展示能力边界,AWS卖的是把这种能力部署到生产环境的脚手架。
理解这个区别,是理解整个Agent基础设施战争的起点。
第一层:发生了什么
GA意味着什么,不意味着什么
在AWS的产品生命周期里,Preview和GA之间有一道真实的鸿沟。Preview阶段的产品不受SLA保护,定价可能变动,API可能破坏性更新,企业采购部门的标准答案是”等GA再说”。这不是保守——这是理性。一个Preview产品进入生产环境,等于把业务连续性押注在一个没有合同保障的服务上。
Bedrock AgentCore从2026年4月进入Preview,到6月18日正式GA,中间只有约8周。这个速度本身是一个信号——AWS在加速。作为对比,Amazon Bedrock本身从2023年9月Preview到2023年11月GA用了约2个月,而SageMaker从Preview到GA经历了超过6个月。AgentCore的8周周期介于两者之间,但考虑到其架构复杂度(6个独立组件),这个速度表明AWS对Agent基础设施的战略优先级极高。
GA版本的核心架构由6个组件构成(来源:AWS Machine Learning Blog, 2026-06-18):
Runtime:提供隔离的文件系统和shell环境。这是Agent执行代码的沙箱,解决的是”Agent运行在哪里”的问题。没有安全隔离的执行环境,Agent执行任意代码就是安全噩梦。AWS在这里复用了其在Lambda和Firecracker微虚拟机上积累的隔离技术经验——Firecracker最初为Lambda开发,现在这项技术的变体为Agent提供毫秒级启动的安全沙箱。
Memory:跨会话的用户记忆持久化。解决的是”Agent记住什么”的问题。无状态的LLM调用是无法完成需要多轮、跨时间的工作任务的。一个帮助用户管理项目的Agent,如果每次对话都从零开始,它就不是助手,而是一个需要反复教育的新员工。
Tool Gateway:AWS技能目录加MCP服务器集成。这是Agent的手——它能触达哪些外部系统,决定了它能完成什么任务。
Browser:网页浏览能力。Agent需要从非结构化的网页世界获取信息和执行操作。
Identity:身份认证层。Agent代表用户执行操作时,谁在授权、谁在承担责任,这是企业部署的合规前提。
Observability:实时流式追踪。当Agent在生产环境出错,你需要知道它在哪一步、为什么、用了什么工具。没有可观测性,生产调试是盲盒。
对外暴露的API极度简化:CreateHarness定义Agent,InvokeHarness运行Agent。两个API调用。这种极简的API设计是AWS的一贯哲学——把复杂性封装在服务内部,对外暴露最小的接口面。
AWS博客引用了Simon Willison对Agent的定义:”An LLM agent runs tools in a loop to achieve a goal”。这个定义精准——也正是这个定义揭示了为什么基础设施层如此重要:loop的稳定性、tools的可靠性、goal的可验证性,每一个都需要独立的工程解决方案。
一个被低估的技术细节
AgentCore Harness支持在运行途中切换LLM提供商,且不丢失上下文。
这个特性在AWS的公告里只是一句话,但它的含义值得展开。在Agent工作流中,上下文窗口承载着任务状态、工具调用历史、中间结果——这是Agent的”工作记忆”。如果切换模型意味着重置上下文,那么LLM提供商就对Agent运行有强绑定。AgentCore的设计选择是:上下文归平台管理,模型是可替换的计算单元。
这是一个非常清晰的架构哲学声明,也是一个非常清晰的商业声明。它意味着AWS把Agent的”大脑”(推理能力)和”神经系统”(记忆、工具连接、执行状态)做了解耦。大脑可以换,但神经系统在AWS上。
第二层:为什么重要
生产就绪性是真正的护城河
过去18个月,Agent演示遍地都是。LangChain、AutoGen、CrewAI、各种开源框架让任何工程师都能在笔记本上跑出一个”能用的Agent”。根据GitHub的统计,2025年标记为”AI Agent”的仓库数量同比增长超过340%。但从笔记本到生产有一道工程债的悬崖:
并发处理:演示场景是单用户单任务。生产环境是数千个并发Agent实例,每个都在执行独立的工具调用链。资源调度、隔离、排队——这是分布式系统问题,不是提示词工程问题。一个中型企业的客服Agent系统可能需要同时处理500+并发会话,每个会话包含多轮工具调用。
故障恢复:Agent执行是有状态的长时间操作。网络抖动、工具调用超时、LLM API限速——任何一个节点失败都可能导致任务状态损坏。生产级Agent需要检查点、重试逻辑、状态回滚。根据Datadog 2025年的AI基础设施报告,生产环境中Agent工具调用的失败率在3%-8%之间,这意味着一个包含10步工具调用的任务有26%-56%的概率遇到至少一次失败。
安全边界:Agent执行代码、访问外部系统、代表用户操作——每一步都是潜在的安全面。隔离的执行环境(Runtime)和细粒度的身份认证(Identity)不是可选项,是企业部署的门票。2025年OWASP发布的LLM应用安全Top 10中,”不安全的Agent操作”被列为第三大风险类别。
可观测性:当Agent在生产环境产生错误结果,你需要完整的执行轨迹:它调用了哪些工具,收到了什么响应,做了什么推理,为什么走了错误的分支。Observability组件提供的实时流式追踪,是事后审计和实时监控的基础。
合规审计:金融、医疗、法律行业的Agent部署需要完整的操作日志,用于监管审计。这不是技术需求,是法律需求。美国OCC(货币监理署)在2025年12月发布的AI使用指南中明确要求金融机构对AI Agent的每一步操作保留可审计的记录。
AWS用AgentCore Harness打包了这6个维度的生产就绪性。对于一个自建团队,每一项都是独立的工程项目,累计是数月的开发周期和持续的维护负担。对于一个想要快速部署Agent能力的企业团队,这是一个make-or-buy的决策。
AWS的赌注是:大多数企业会选择buy。
从”AI功能”到”AI基础设施”的范式跃迁
理解AgentCore GA的更大意义,需要回溯AWS在云计算史上的标准剧本。
2006年,S3和EC2正式发布。存储和计算从企业自建变成按需购买的基础设施。2014年,Lambda GA。无服务器计算让”函数”成为可计费单元。2017年,SageMaker GA,把机器学习训练和部署变成托管服务。每一次GA,都是把一个原本需要自建的能力层变成云端固化的服务。
AgentCore Harness的GA是同样的逻辑在AI Agent层的复现:把”Agent执行环境”变成可计费的基础设施。
这个转变的商业含义是:AWS不再只是Agent的计算底座(提供GPU算力跑模型),而是Agent的运行时平台(提供完整的执行环境)。前者是大宗商品竞争,后者是平台生态竞争。大宗商品的竞争武器是价格,平台生态的竞争武器是转换成本。
AWS选择了后者。根据AWS 2026年Q1财报(来源:Amazon Investor Relations, 2026-04-30),AWS营收达到293亿美元,同比增长19%。但更值得注意的是,AWS CEO Matt Garman在财报电话会议中特别提到”AI-native workloads”的增长率超过整体增长率的3倍。Agent基础设施是这个增长引擎的核心组件。
第三层:大多数人没看到什么
“模型无关”是战略,不是特性
AgentCore支持中途切换LLM提供商不丢上下文,被很多报道解读为”灵活性”或”用户友好”。这是表面解读。
真正的战略逻辑是:AWS正在把自己定位为LLM的上层,而不是LLM的竞争者。
AWS自己有Titan系列模型,但Bedrock更核心的价值主张一直是”多模型市场”——Anthropic的Claude、Mistral、Meta的Llama、Stability AI,全部可以通过统一API调用。这个设计让AWS在模型军备竞赛中置身事外:谁的模型更好,用户可以切换,但他们仍然在Bedrock上运行,仍然在向AWS付费。
AgentCore把这个逻辑推进了一步:不只是模型调用API无关,连Agent的运行状态、记忆、工具连接都托管在AWS。模型变成了一个可插拔的推理引擎,而Agent的”神经系统”——它的记忆、它的工具、它的身份、它的执行历史——全部归AWS管理。
这是一个比”多模型API”更深的锁定。类比来说:如果Bedrock的多模型API是让你可以换餐厅的厨师,AgentCore是让你把整个厨房(设备、食材供应链、菜谱库、顾客偏好数据)都托管在AWS。厨师可以换,但厨房搬不走。
Anthropic的两面性:AWS的关键合作伙伴,也是潜在的平台竞争者
2026年6月18日同一天,Anthropic发布Project Fetch Phase 2(来源:Anthropic Research, 2026-06-18)。Claude在无人辅助下完成机器人控制任务,速度比有Claude辅助的团队快18倍,比无Claude团队快37倍。研究员的角色被限制为:插上笔记本、输入初始提示词、批准命令。
Anthropic观察到的三阶段演化模式——”首先,模型帮助人类;然后,人类帮助模型;最终,模型基本上能独立完成任务”——是一个关于能力曲线的重要陈述。这个模式在网络安全领域已经出现(Anthropic此前的研究系列),现在在物理世界开始出现。
这对AgentCore意味着什么?
一方面,更强的模型能力验证了Agent基础设施的价值。如果模型能独立完成复杂任务,那么稳定可靠的Agent执行环境就更重要,而不是更不重要。AgentCore提供的正是这个执行环境。
另一方面,Anthropic自己也在向持久化Agent工作区方向演进。Claude Code的能力迭代表明Anthropic正在构建自己的Agent执行层。如果Anthropic的Agent平台足够完整,部分企业客户可能直接在Anthropic的平台上构建,绕过Bedrock。
AWS和Anthropic的关系是云计算史上最复杂的投资-竞争关系之一。AWS是Anthropic的重要云基础设施合作伙伴(Amazon在2023年9月至2024年3月间向Anthropic投资总计40亿美元,来源:Amazon Press Release, 2024-03-27),Anthropic的Claude是Bedrock上最受欢迎的模型之一。但在Agent平台层,两家公司的战略边界正在变得模糊。
更值得注意的是Anthropic面临的地缘政治复杂性。2026年6月18日,Reuters报道JPMorgan Chase切断了香港员工对Anthropic AI工具的访问权限(来源:Reuters, 2026-06-18)。同一周内,Anthropic的部分高级模型能力面临出口管制限制的讨论。Anthropic在其公开的IPO相关文件中将”政府监管和出口管制风险”列为核心风险因素之一。
这一系列事件构成了一个信号:前沿AI模型提供商面临的地缘政治风险正在快速具象化。对于企业客户来说,把Agent的核心运行时托管在一个可能面临监管不确定性的模型提供商,和托管在AWS这样的基础设施巨头,风险等级是不同的。
AgentCore的架构设计——模型可替换,平台持久——在这个背景下有了新的含义:它是一个风险隔离机制。当某个模型提供商面临监管风险或服务中断,企业的Agent工作流不需要重建,切换模型即可。这不是假设性场景——JPMorgan的决定证明了这种风险已经在影响企业的技术选择。
工具生态是真正的战场
AgentCore的Tool Gateway集成了AWS技能目录和MCP服务器。这个细节在大多数报道中被一笔带过,但它是整个平台战略的核心节点。
Agent的价值来自它能连接的系统。一个能调用S3、DynamoDB、Lambda、SageMaker、各种AWS托管数据库的Agent,和一个只能调用通用HTTP API的Agent,完成复杂企业任务的能力差距是量级的。AWS把自己的200+服务目录直接集成进Tool Gateway,等于给在AWS生态内构建的Agent提供了天然的能力优势。
具体来说,一个在AWS上运行的企业Agent可以直接:查询RDS中的客户数据、触发Lambda函数执行业务逻辑、读写S3中的文件、调用SageMaker端点进行预测、通过SES发送邮件、通过SNS发送通知——所有这些都通过Tool Gateway的统一接口,无需为每个服务单独构建集成。
同时,MCP(Model Context Protocol)的集成是一个开放性信号。MCP是Anthropic于2024年11月推出的工具调用标准协议(来源:Anthropic Blog, 2024-11-25),已被多家公司采用,包括Cursor、Replit、Sourcegraph等开发工具。AgentCore支持MCP服务器,意味着第三方工具提供商可以通过标准接口接入,这会扩大Tool Gateway的覆盖范围,同时增加平台黏性——工具生态越丰富,迁移成本越高。
这是AWS在云计算早期建立生态的逻辑在Agent层的复现:不是自己做所有工具,而是成为工具聚合的平台,从聚合中获取网络效应。AWS Marketplace在2025年的第三方软件交易额超过160亿美元(来源:AWS re:Invent 2025 Keynote),Tool Gateway有潜力成为Agent时代的Marketplace。
可观测性:被忽视的企业部署门票
AgentCore的Observability组件提供实时流式追踪,这在技术报道中通常被归类为”运维功能”,是枯燥的工程细节。
但对于企业部署,这是最关键的特性之一,原因在于企业的信任建立机制。
当一个人类员工做出错误决策,企业有完整的审计轨迹:邮件记录、系统日志、会议记录。当一个Agent做出错误决策——比如发送了错误的报价单、删除了错误的数据、提交了错误的代码变更——企业需要同样的审计能力。没有可观测性,Agent就是一个黑盒,企业法务和合规部门不会批准黑盒系统承担关键业务操作。
Gartner在2025年11月的报告中预测,到2027年,75%的企业AI项目失败将归因于”缺乏充分的可观测性和治理机制”,而非模型能力不足(来源:Gartner, “Predicts 2026: AI Engineering”, 2025-11-15)。这个预测的核心洞察是:企业AI部署的瓶颈不是”AI能不能做”,而是”我们能不能信任它在做什么”。
实时流式追踪还有另一个价值:成本控制。Agent在执行复杂任务时可能产生大量LLM调用,每一次调用都有成本。以Claude Sonnet为例,输入token价格为$3/百万token,输出为$15/百万token。一个执行复杂研究任务的Agent可能在单次任务中消耗50万+token。如果没有实时可见性,一个失控的Agent循环可能在你察觉之前产生数百美元的API调用费用。Observability是成本护栏,不只是调试工具。
第四层:竞争格局与战略预判
三路夹击:Azure、Google、OpenAI
AgentCore GA发生在一个竞争格局快速成形的时刻。
Azure AI Agent Service:微软在2025年11月的Ignite大会上宣布了Azure AI Agent Service的Preview(来源:Microsoft Azure Blog, 2025-11-19),并在2026年初加速推进。Azure的策略是深度整合Microsoft 365生态——Copilot Studio、Power Platform、Dynamics 365——让企业Agent可以直接操作Office文档、Teams消息、SharePoint内容。对于深度使用Microsoft生态的企业,这种集成深度是AWS难以复制的。Azure的赌注是:企业的工作流已经在Microsoft生态中,Agent应该在同一个生态中运行。
Google Vertex AI Agent Builder:Google在2024年Google Cloud Next上发布了Agent Builder(来源:Google Cloud Blog, 2024-04-09),并在2025-2026年持续迭代。Google的优势在于其搜索、地图、Gmail等产品提供的工具集成天然比其他云厂商丰富,同时Gemini模型的长上下文能力(支持100万+ token上下文窗口)对需要处理大量文档的Agent场景有独特优势。Google的弱点是企业市场份额——根据Synergy Research Group 2026年Q1数据,Google Cloud的IaaS/PaaS市场份额约为12%,远低于AWS的31%和Azure的25%。
OpenAI Assistants API/Responses API:OpenAI在2023年11月发布Assistants API,2025年持续向Agent平台方向演进。OpenAI的优势是开发者心智——大量Agent应用最初用OpenAI API原型开发,迁移有惰性成本。OpenAI的劣势是它不是云基础设施提供商,缺乏企业级的安全合规认证体系和全球数据中心网络。OpenAI与微软的关系也增加了其独立平台战略的复杂性。
在这个竞争格局中,AWS的差异化优势是什么?
企业信任基础:AWS有20年的企业级SLA、合规认证(SOC 2、ISO 27001、HIPAA、FedRAMP High等143项安全合规认证)、安全体系。一个新的Agent平台提供商需要数年才能建立同等的企业信任基础。
工具生态深度:AWS 200+服务目录的广度和深度是其他平台难以在短期内复制的。一个深度使用AWS的企业,其数据在S3,业务逻辑在Lambda,数据库在RDS/DynamoDB——AgentCore可以直接连接所有这些,无需额外的集成工作。
计算底座:Agent的大规模部署需要稳定的计算资源。AWS在全球34个地理区域、108个可用区的数据中心基础设施和弹性计算能力,是Agent大规模商业化的基础保障。
但AWS也有结构性弱点:它不是模型能力最强的提供商。Anthropic的Claude、OpenAI的GPT系列、Google的Gemini在各种基准测试中交替领先,AWS的Titan系列从未进入第一梯队。如果Agent的价值主要来自模型的推理能力,AWS在这场竞争中的护城河就会变浅。这也是为什么AWS需要”模型无关”的架构——它在用平台黏性对冲模型能力的劣势。
两个对立视角的碰撞
视角一:AgentCore是正确的战略赌注——基础设施标准化的先发优势
这个视角认为,Agent基础设施的标准化是不可避免的,就像容器编排最终收敛到Kubernetes(2014年开源,到2019年成为事实标准),无服务器计算最终收敛到几个主要平台。先发布生产就绪的平台,先建立工具生态,先获取企业客户的部署锁定,就能在标准化完成后占据主导地位。
支撑这个视角的证据:
- 企业采购周期通常为6-12个月,先GA的平台先进入评估流程
- 工具生态有网络效应——第三方工具提供商会优先集成用户最多的平台
- AWS的企业客户基础(数百万活跃客户)提供了冷启动优势
- Agent工作流一旦构建,迁移成本极高(记忆数据、工具集成、身份配置都需要重建)
视角二:AgentCore来得太早,也可能来得太晚——技术演化可能颠覆当前架构
这个视角认为,Agent技术本身仍在快速演化,今天的基础设施架构可能在12个月后被颠覆。如果Agent的执行范式发生根本性变化——比如从”工具循环”转向更接近端到端推理的架构,或者模型内置的工具调用能力使得外部编排层变得多余——AgentCore的6个组件设计可能需要根本性重构。
支撑这个视角的证据:
- 开源框架(LangGraph、AutoGen、CrewAI等)的快速迭代让自建成本持续下降
- 模型能力的快速进步可能使得部分基础设施组件(如Memory)变得不必要——如果模型的上下文窗口足够大,外部记忆层的价值就会降低
- 2024-2025年已经有多个Agent框架从热门变成过时(如BabyAGI、AutoGPT的早期版本),技术路径的不确定性仍然很高
- 部分企业可能选择等待标准更成熟再投入,而不是在当前阶段锁定
视角三(常被忽略):真正的竞争不在云厂商之间,而在”平台”vs”垂直整合”之间
这个视角认为,最大的竞争威胁不是Azure或Google,而是模型提供商的垂直整合。如果Anthropic或OpenAI提供从模型到Agent运行时到工具集成的完整栈,并且模型能力优势足以抵消基础设施劣势,部分高价值客户会选择垂直整合方案。这类似于Apple的策略——硬件+操作系统+应用商店的垂直整合,在高端市场击败了水平分层的竞争对手。
我的判断:视角一在未来18个月内更接近现实,但视角三是3-5年维度的真正风险。
关键判断依据是企业采购的决策逻辑。大多数企业采购Agent基础设施不是因为它是最先进的,而是因为它足够可靠、足够合规、足够可解释。AgentCore GA提供的正是这些属性。技术演化风险确实存在,但AWS有足够的资源在架构演化时进行平台升级,同时保持向后兼容——这是大型云平台的标准能力(AWS Lambda从2014年至今经历了多次架构升级,但API向后兼容)。
真正的风险不是技术演化,而是模型提供商向下延伸。如果Anthropic或OpenAI在未来2-3年内构建出足够完整的Agent平台,并且模型能力优势持续扩大,AWS的”模型无关”策略可能从优势变成劣势——因为最好的模型不在你的平台上运行。这是AWS需要持续监控的战略风险。
下一步棋:AWS会怎么走
基于AgentCore GA的战略逻辑,可以推断AWS的下一步动作方向:
工具生态的深度扩展:Tool Gateway的价值与可调用工具的数量和质量正相关。预计AWS会积极拓展第三方工具提供商的MCP集成,同时把更多AWS原生服务深度接入Tool Gateway。具体预测:2026年下半年,AWS将发布Tool Gateway的合作伙伴计划,类似于早期的AWS Partner Network(APN),为第三方工具提供商提供认证和分发渠道。
Memory层的能力升级:跨会话记忆是Agent从”单次任务执行器”进化为”长期工作伙伴”的关键。当前的Memory组件提供基础的用户记忆持久化,但更复杂的记忆结构——知识图谱、情境感知、个性化学习——是下一阶段的竞争点。Google在这方面有天然优势(搜索引擎本质上是一个巨大的知识图谱),AWS需要在Memory层构建差异化。
多Agent协调:当前AgentCore的核心是单Agent的生产就绪性。但复杂的企业任务需要多个专业Agent协同工作——研究Agent、代码Agent、审核Agent分工协作。多Agent编排是Agent平台的下一个能力层。微软的AutoGen框架已经在这个方向上有了显著进展,AWS不会缺席。预计2026年Q4或2027年Q1,AWS会发布多Agent协调的Preview功能。
垂直行业深化:金融、医疗、法律等高监管行业有特殊的合规需求,同时也有最强的Agent部署意愿(这些行业的知识工作密度最高,自动化的ROI最大)。针对垂直行业的预配置Agent模板和合规工具包,是差异化竞争的有效路径。AWS已经有HealthLake(医疗)、FinSpace(金融)等垂直行业服务,将这些与AgentCore深度集成是自然的下一步。
技术-商业交叉:Anthropic Project Fetch的镜像意义
回到6月18日的另一件事:Anthropic Project Fetch Phase 2(来源:Anthropic Research, 2026-06-18)。
Claude比有Claude辅助的团队快18倍,比无Claude团队快37倍。研究员被限制为最小角色。仍然失败的是”用机器人抓取海滩球”的低层次actuator control。大量代码第一次就运行成功。
这个研究报告对AgentCore的意义是间接但深刻的。
Project Fetch展示的是Agent能力的前沿——在物理世界的自主操作能力。AgentCore解决的是Agent能力的部署问题——如何把这种能力稳定地运行在企业生产环境。两者之间有一个能力转化的管道问题:前沿能力需要经过工程化、产品化、平台化,才能变成企业可用的服务。AgentCore正是这个管道的关键一段。
Anthropic观察到的三阶段演化模式——”首先,模型帮助人类;然后,人类帮助模型;最终,模型基本上能独立完成任务”——在数字世界(代码生成、数据分析、文档处理)的演化速度远快于物理世界。这意味着企业部署数字Agent的紧迫性高于物理Agent,AgentCore的目标市场首先是数字工作流的自动化。
但Project Fetch的另一个发现值得注意:仍然失败的是低层次actuator control,而不是高层次任务规划。这意味着模型的推理能力(规划、代码生成、工具调用策略)已经远超其物理执行能力。在纯数字环境中,这个瓶颈不存在——Agent的执行就是代码运行和API调用,而这些是确定性的。
这是为什么数字Agent的生产就绪性在2026年成为可能,而不是2024年。模型的推理能力已经越过了一个阈值,使得稳定的工具调用循环成为可靠的任务执行机制。AgentCore的GA时机,正好卡在这个能力阈值之后。这不是巧合——AWS的产品团队显然在等待模型能力达到”足够好”的水平,才把Agent执行环境推向GA。太早GA意味着Agent经常失败,损害平台信誉;太晚GA意味着竞争对手先占据市场。8周的Preview-to-GA周期表明,AWS判断这个窗口已经打开。
对读者意味着什么
对企业技术决策者
如果你的团队已经在评估Agent部署,AgentCore GA改变了make-or-buy的经济账。自建生产级Agent基础设施的6个核心组件(隔离执行、持久记忆、工具网关、浏览器、身份认证、可观测性)需要独立的工程投入,且每一个都有长尾的维护成本。保守估计,一个5人工程团队需要4-6个月构建等效的基础设施,且后续维护成本不低于2名全职工程师。
AgentCore的竞争者不只是其他云平台的Agent服务,还包括你自己团队的工程时间。对于大多数不以基础设施为核心竞争力的企业,这个时间应该花在业务逻辑上,而不是Agent运行时的工程细节。
但有一个重要警告:工具生态的选择会产生长期锁定。在选择AgentCore之前,评估你的工具连接需求是否与AWS服务目录高度重叠——如果是,锁定是合理的,因为你已经在AWS生态中;如果你的核心工具是非AWS系统(Salesforce、SAP、ServiceNow、Microsoft 365等),需要评估Tool Gateway通过MCP的覆盖范围是否满足需求。
具体建议:在2026年Q3启动一个有限范围的Agent试点项目(比如内部IT支持Agent或文档处理Agent),用AgentCore构建,评估6个组件的实际表现和集成复杂度。不要在没有实际使用经验的情况下做大规模采购决策。
对AI基础设施创业公司
AgentCore GA压缩了通用Agent基础设施创业的市场空间。如果AWS提供了生产就绪的通用Agent运行时,独立的”Agent执行平台”创业公司面临的竞争压力显著上升。这类似于2015年后,独立的”容器编排平台”创业公司在Kubernetes+云厂商托管服务的夹击下逐渐消失。
差异化的生存路径是垂直化:特定行业的合规需求(医疗的HIPAA深度集成、金融的SOC 2+实时监控、法律的数据主权和特权保护)、特定任务的深度优化(代码Agent的IDE集成、数据分析Agent的可视化能力、客户服务Agent的情感识别)、特定集成的深度(与Salesforce、SAP、ServiceNow等企业软件栈的深度原生集成)。
通用层正在被云巨头固化,垂直层仍然是开放竞争地带。但窗口在收窄——AWS的垂直行业深化是可预见的下一步。
对模型提供商
AgentCore的”模型无关”架构是一个清晰的信号:AWS不打算在模型能力竞赛中下注,它在平台层构建护城河。这对Anthropic、Mistral、Meta等模型提供商意味着:Bedrock仍然是重要的分发渠道,但平台层的增值越来越多地被AWS截留。
长期来看,模型提供商面临三条路径:
- 接受成为AWS平台上的推理引擎(高流量,低溢价)——这是大多数中小模型提供商的命运
- 构建足够完整的垂直整合平台(高溢价,有限规模)——这是OpenAI和Anthropic正在尝试的方向
- 找到AWS无法覆盖的差异化场景(模型能力的极端前沿,比如Project Fetch展示的自主Agent能力)——这需要持续的研究领先
Anthropic目前三条路都在走,这也是为什么它的战略最难被简单归类。它既是Bedrock上的推理引擎,又在构建自己的Agent平台(Claude Code、Claude for Enterprise),又在推进前沿能力研究(Project Fetch)。这种多路径策略的风险是资源分散,优势是保持战略灵活性。
结语:基础设施固化的历史节点
AWS的核心愿景一直是把IT基础设施变成”水电煤”——按需使用,按量付费,无需自建。S3和EC2在2006年是这个愿景的第一步。
2026年6月18日,AgentCore Harness GA是这个愿景在AI层的延伸:把Agent执行环境变成”水电煤”。
这个类比不是修辞,是一个有预测力的框架。水电煤基础设施固化后,用水量和用电量成为经济活动的代理指标。同样,当Agent执行环境变成基础设施,Agent调用量将成为企业数字化程度的代理指标,而AWS将从中获取比例收益。
但历史也告诉我们,基础设施固化会创造新的应用层机会。电力固化之后出现了家电行业;互联网基础设施固化之后出现了Web 2.0;云计算固化之后出现了SaaS浪潮——Salesforce、Workday、ServiceNow等公司在云基础设施之上构建了数千亿美元的市值。Agent基础设施固化之后,应用层的机会窗口正在打开。
谁会建造Agent时代的”家电”? 这是比AgentCore GA更大的问题。如果历史模式重复,最大的价值创造不会发生在基础设施层(AWS、Azure、Google会分享这个市场),而会发生在基础设施之上的应用层——那些用Agent能力重新定义工作流的公司。
这也是接下来几年最值得持续追踪的战略问题。AgentCore GA不是终点,是起跑线。
参考资料
-
Amazon Bedrock AgentCore Harness is now generally available: Go from idea to production-grade agent in minutes — AWS Machine Learning Blog (Kosti Vasilakakis, Alexander Richey, Evandro Franco, Vivek Dalal), 2026-06-18
-
Project Fetch Phase 2: Claude autonomous robot control — Anthropic Research, 2026-06-18
-
JPMorgan Chase cuts off Anthropic access to its Hong Kong staff — Reuters / Financial Times, 2026-06-18
-
Amazon and Anthropic deepen their shared commitment to advancing generative AI — Amazon Press Release, 2024-03-27
-
Introducing the Model Context Protocol — Anthropic Blog, 2024-11-25
-
Project Fetch: Robot dog experiments with Claude — Anthropic Research, 2025-08-01
-
Build AI agents and agentic AI apps with Azure AI Agent Service — Microsoft Azure, 2025-11-19
-
Amazon.com Q1 2026 Earnings Release — Amazon Investor Relations, 2026-04-30
主题分类:AI企业应用与基础设施