当机器人不再需要人类搭把手：Project Fetch Phase 2 与具身AI自主性的质变临界点

2026年6月18日，Anthropic发布了一份措辞克制却意义深远的研究报告。在Project Fetch Phase 2的实验中，Claude Opus 4.7在无任何人工辅助的条件下，完成了10个月前Phase 1中Claude Opus 4.1连第一步都跨不过去的机器人控制任务。根据Anthropic Research公布的实验数据，在两组人类团队都能完成的4个核心任务中，Opus 4.7的完成速度比没有AI辅助的人类团队快37倍，比有Claude辅助的人类团队快18倍。(来源: Anthropic Research, 2026-06-18)

这里的”37倍”是任务完成时间的倍数——即人类团队完成某项任务所需的时间，是Claude Opus 4.7独立完成同一任务所需时间的37倍。需要注意的是，这个倍数反映的是端到端任务完成时间的比较，而非单一操作步骤的速度差异。举例而言，如果人类团队需要74分钟完成一项机器人导航与扫描任务，Claude Opus 4.7仅需约2分钟。快18倍则意味着，即便是”人机协作”这一被普遍视为最优解的工作模式，在这些结构化任务维度上已经开始被纯AI自主执行所超越。

但更关键的不是速度数字本身，而是Anthropic研究团队在报告中记录的一个演化模式——他们将其概括为三个阶段：”首先，模型帮助人类；然后，人类帮助模型；最终，模型基本上能独立完成任务。”(来源: Anthropic Research, 2026-06-18)

这句话，是理解当前AI发展阶段最精准的坐标系之一。

从Phase 1到Phase 2：10个月内发生了什么

要理解Phase 2的意义，必须先回到2025年8月的Phase 1实验现场。

那是一个仓库场景。Anthropic让两组人类分别在有Claude Opus 4.1辅助和没有AI辅助的条件下执行机器人控制任务，使用的硬件是商业四足机器人（robodog）。结论是：有Claude辅助的团队表现更好。这个结论在当时看起来已经足够令人印象深刻——它证明了AI作为”副驾驶”的价值。(来源: Anthropic Research, 2025-08-01)

然而Phase 1同时记录了一个重要失败：Claude Opus 4.1无法独立完成任务，在连接机器人这个最初始的阶段就已经卡住。换句话说，AI在Phase 1中的角色，严格来说是”工具”——它增强了人类的能力，但它自己什么都做不了。

10个月后，Phase 2颠覆了这个结论。

在Phase 2的实验设计中，研究员的角色被刻意压缩到最小化。根据Anthropic报告的描述，人类介入主要包括：物理层面的硬件准备（插上笔记本电脑）、输入初始提示词、以及在关键节点批准命令执行。(来源: Anthropic Research, 2026-06-18) 需要指出的是，这一描述是对实验条件的概括性总结——实际实验中可能还涉及安全监控和异常情况下的人类干预，但报告强调的核心信息是：相比Phase 1中需要人类全程深度参与，Phase 2中人类的角色已经从”协作者”退化为”启动者和监督者”。

代码生成质量是其中一个关键指标：报告特别指出，大量代码第一次就运行成功（first-time success）。这个细节很重要。在机器人控制场景中，代码生成-执行-反馈的循环是核心工作流。如果第一次就能跑通，意味着模型对任务的理解、对硬件接口的推理、对边界条件的处理，已经达到了相当高的可靠性阈值。对比Phase 1中Claude Opus 4.1连建立机器人连接都无法完成的状态，这个跨越在10个月内完成，速度超出了大多数业内预期。

当然，Phase 2并非没有失败。报告诚实地记录了一个至今仍无法攻克的难关：Claude Opus 4.7仍然无法精确完成”用机器人抓取海滩球”这一物理动作。这涉及到低层次的actuator control——对关节角度、力度、时序的精细控制，这是一个纯粹的物理世界精度问题，与语言理解和任务规划能力是两个不同的维度。(来源: Anthropic Research, 2026-06-18)

这个失败案例实际上划定了一条清晰的能力边界：当前AI自主性的突破发生在认知层（任务理解、代码生成、工具调用、多步规划），而非执行层（精细运动控制）。 这个区分对于理解”AI自主性”究竟意味着什么，至关重要。

三阶段演化模式：一个被低估的分析框架

Anthropic在报告中提出的三阶段演化模式——”模型帮助人类→人类帮助模型→模型独立完成任务”——不是第一次出现在他们的研究叙事中。

报告明确指出，同样的模式在网络安全领域已经先行出现。Anthropic在其网络安全研究线中开发的Fable系列模型（包括后续的Fable 5和Mythos 5），在漏洞发现和利用任务中经历了完全相同的三阶段演化。(来源: Anthropic Research, 2026-06-18) 关于Fable系列的详细技术报告，Anthropic在2026年上半年通过其官方研究页面陆续发布，但截至本文撰写时，独立的Fable系列综述论文尚未在公开学术平台上线。现在，这个模式开始向物理世界渗透。

这个三阶段框架之所以值得深究，是因为它揭示了一个反直觉的中间状态：第二阶段——”人类帮助模型”——是整个演化过程中最容易被误读的阶段。

在第二阶段，表面现象是”AI还不够好，需要人来填补漏洞”。这很容易让人得出”AI还不成熟”的结论。但这个判断忽略了一个关键动态：正是在第二阶段，模型通过人类的介入获得了大量高质量的反馈数据，而这些数据又反过来推动模型向第三阶段跃迁。人类在第二阶段的”帮助”，本质上是在为AI的自主化建立训练基础。

从Phase 1到Phase 2，10个月的时间跨度对应的正是这个从第二阶段向第三阶段的跃迁窗口。这个窗口的缩短速度，比大多数行业观察者预期的要快。作为参照，Boston Dynamics从2013年被Google收购到2020年Spot商业化，经历了7年的迭代周期；而Anthropic从”AI无法独立连接机器人”到”AI独立完成完整任务链”，仅用了10个月。当然，这两者的技术栈和任务复杂度不同，但时间尺度的压缩本身就是一个信号。

更值得关注的是这个模式的跨域传播速度。从网络安全（数字世界）到机器人控制（物理世界），这两个领域在技术特性上差异极大——前者的”执行环境”是软件系统，后者的”执行环境”是物理空间——但演化路径却高度相似。这暗示着，这个三阶段模式可能不是特定领域的产物，而是大语言模型与工具使用能力结合后的通用演化规律。

如果这个推断成立，那么我们可以开始为其他尚在第一阶段或第二阶段的领域估算其到达第三阶段的时间线。例如，在药物发现领域，当前AI的角色主要是”帮助人类研究员筛选候选分子”（第一阶段末期/第二阶段初期）；在自动驾驶领域，L4级别的系统仍然需要远程人类操作员在边缘案例中介入（第二阶段中期）。如果三阶段跃迁的时间窗口持续缩短，这些领域的自主化时间线可能需要被重新评估——尽管这类预测在当前技术加速期内存在极大的不确定性。

具身AI的基础设施层：AgentCore Harness的同步GA

Project Fetch Phase 2的发布并非孤立事件。同一天，2026年6月18日，Amazon Bedrock AgentCore Harness宣布正式GA（General Availability）。(来源: AWS Machine Learning Blog, 2026-06-18)

这个时间上的巧合，实际上揭示了一个更深层的结构性趋势：AI自主性能力的突破，正在与支撑这种自主性的基础设施层同步成熟。

AgentCore Harness的技术架构值得仔细拆解。AWS博客作者Kosti Vasilakakis、Alexander Richey、Evandro Franco和Vivek Dalal在发布文章中描述了其核心组件：Runtime（提供隔离的文件系统和shell环境）、Memory（跨会话的用户记忆持久化）、Tool Gateway（AWS技能目录加上MCP服务器支持）、Browser（网页浏览能力）、Identity（身份认证）、Observability（实时流式追踪）。(来源: AWS Machine Learning Blog, 2026-06-18)

从这个组件列表可以读出一个清晰的设计哲学：AWS在为AI Agent构建一个完整的”生存环境”。隔离的Runtime意味着Agent可以在受控的沙箱中安全执行代码；跨会话Memory意味着Agent不再是无状态的、每次从零开始的工具；Tool Gateway意味着Agent可以调用外部世界的能力；Observability意味着人类可以在不介入的前提下监控Agent的行为。

这套基础设施的核心价值，恰恰是为”人类最小介入”的工作模式提供技术保障。如果没有隔离的Runtime，Agent执行代码会带来安全风险；如果没有持久化Memory，Agent无法在长周期任务中维持上下文；如果没有Observability，人类无法信任一个黑箱式的自主执行者。

博客中引用了Simon Willison对Agent的定义：”An LLM agent runs tools in a loop to achieve a goal。”(来源: AWS Machine Learning Blog, 2026-06-18) 这个定义精炼地捕捉了Agent与普通LLM调用的本质区别：循环。不是一次性的问答，而是持续的目标导向执行。AgentCore Harness的设计正是围绕这个”循环”来构建的——它提供了让循环安全、持久、可观测地运行所需的全部基础设施。

AgentCore Harness的GA时间节点同样值得注意：它在2026年4月进入Preview，2个月后正式GA。这个从Preview到GA的速度，反映了市场对Agent基础设施的需求强度。

AWS博客中还提到了一个关键的架构设计决策：AgentCore Harness支持在不同LLM提供商之间切换，同时保持Agent的上下文和状态不丢失（作者概括，原文表述可能有所不同）。这个设计选择揭示了AWS在Agent基础设施市场中的定位策略——它选择做”中立平台”而非”绑定特定模型”。

值得一提的竞争格局：Microsoft在2026年3月宣布Azure AI Foundry Agent Service的Runtime层免费提供，以零成本策略换取开发者向Azure生态的迁移。(来源: Microsoft Azure Blog, 2026-03) Google Cloud的Vertex AI平台同期在加速构建Agent运行时能力，2026年5月的Google I/O上展示了其Agent Development Kit（ADK）的最新进展。(来源: Google Cloud Blog, 2026-05) OpenAI的Responses API也在向Agent平台方向演进，2026年初已支持多步工具调用和持久化会话。整个云计算行业正在进行一场以Agent基础设施为核心的新一轮平台争夺战。

物理世界自主性的真正门槛在哪里

回到Project Fetch Phase 2的那个失败案例：Claude Opus 4.7无法精确完成”用机器人抓取海滩球”的物理动作。

这个失败不是Bug，而是Feature——它精确地标定了当前AI自主性的真实边界。

要理解这个边界，需要区分两类不同性质的控制问题：

第一类：高层次任务规划与工具调用。 这包括：理解任务目标、分解子任务、生成控制代码、调用传感器接口、处理异常状态、在多个工具之间协调。这是语言模型擅长的领域，因为这些问题本质上是符号推理问题——它们可以被表达为自然语言，可以被分解为逻辑步骤，可以通过代码来实现。Phase 2的成功发生在这个层面。

第二类：低层次精细运动控制。 这包括：在毫秒级时间窗口内调整关节角度、根据力反馈实时修正抓取力度、处理物体表面摩擦系数的不确定性、在动态环境中维持平衡。这是一个连续控制问题，不是离散符号推理问题。语言模型在这个层面没有天然优势，因为它的输出空间是离散的token序列，而不是连续的电机控制信号。

这个区分解释了为什么”用机器人抓取海滩球”对Claude Opus 4.7来说是一个特殊难题：海滩球柔软、轻盈、容易变形，抓取它需要极其精细的力度控制，任何微小的过力都会导致球被推开或挤变形。这是一个典型的低层次精细运动控制问题。相比之下，抓取一个刚性物体（如金属零件）的难度要低得多，因为力度控制的容错区间更大。

然而，这个边界并非不可逾越。当前业界有两条主流路径在攻克这个问题：

路径一：端到端训练。 直接在大量物理交互数据上训练能够输出连续控制信号的神经网络，绕过符号推理层，直接学习从感知到动作的映射。Google DeepMind的RT-2（2023年发布）和后续的RT-X系列是这条路径的代表。Toyota Research Institute在2025年展示的Diffusion Policy方法也属于这一类。

路径二：分层架构。 保留语言模型作为高层次规划器，在其下面接一个专门的低层次控制模型（比如基于强化学习训练的运动控制器），让两层各司其职。NVIDIA的Eureka项目（2023年）和Figure AI的人形机器人系统（2024-2025年）采用了类似的分层思路。

Project Fetch的实验设计更接近路径二的思路——Claude负责任务规划和代码生成，robodog的底层运动控制由其原生系统处理。在这个架构下，Claude的”失败”其实是整个分层系统中高层规划器与低层执行器之间接口精度不足的问题，而不是整个自主化方向的失败。

这个技术细节对于评估”具身AI自主性”的真实进展极为关键，但在大多数媒体报道中被忽略了。

大多数人没看到的：自主性门槛的不对称性

Project Fetch Phase 2引发的讨论，大多集中在”AI变得多快”或”AI会取代人类劳动力”这两个叙事轨道上。这两个轨道都捕捉到了真实的维度，但都错过了一个更根本的结构性变化：自主性门槛的不对称性。

什么是自主性门槛的不对称性？

考虑两种不同的任务类型：

任务类型A：有明确成功标准的结构化任务。 比如”扫描仓库货架、识别缺货位置、生成补货清单、发送给采购系统”。这类任务有清晰的输入输出定义，成功与失败可以被精确衡量，错误可以被检测和修正。

任务类型B：需要持续判断的非结构化任务。 比如”根据当前仓库状态和历史数据，优化未来3个月的库存策略”。这类任务的成功标准模糊，涉及大量隐性知识和价值判断，错误可能在很长时间后才显现。

Project Fetch Phase 2中的机器人控制任务，本质上属于类型A——它们有明确的物理世界成功标准（任务完成/未完成），有实时的传感器反馈，错误会立即显现。正是这种结构化特性，使得Claude Opus 4.7能够在这个场景中实现高可靠的自主执行。

这意味着，AI自主性的实际落地速度，在不同任务类型之间存在巨大的不对称性。结构化任务——无论是数字世界还是物理世界——将以远快于预期的速度实现AI完全自主化。而非结构化任务，尽管AI能力在持续提升，仍然需要人类在价值判断层面保持参与。

这个不对称性有一个重要的商业含义：不是所有的人类工作都会以相同的速度被AI自主化，而是”结构化程度”将成为预测自主化速度的核心变量。

McKinsey在2024年1月发布的《The Economic Potential of Generative AI》报告中估算，全球约60-70%的工作活动在技术上可以被自动化，但这个数字掩盖了巨大的分布差异。Project Fetch Phase 2的实验结果为这个分布差异提供了一个具体的锚点：在高度结构化的物理任务中，AI自主化不仅可行，而且已经比人类快一个数量级以上。

仓库物流、工厂质检、代码审查、数据处理——这些任务的结构化程度高，将率先经历自主化。战略咨询、产品设计、跨文化谈判、危机公关——这些任务的非结构化程度高，AI自主化的时间线将显著更长。

Phase 2的速度数字（比人类快37倍）只在结构化任务这个前提条件下成立。这个前提条件，在大多数关于这项研究的讨论中被省略了。

地缘政治碰撞：自主性能力与访问控制的张力

2026年6月18日，同一天发生了另一件事：据Reuters报道，JPMorgan Chase切断了其香港员工对Anthropic AI工具的访问权限。(来源: Reuters, 2026-06-18)

这个事件乍看与Project Fetch Phase 2毫无关联，但如果将两者放在同一个分析框架下，会浮现出一个令人不安的张力。

当AI自主性能力快速提升——从”帮助人类”到”独立完成任务”——对这种能力的访问控制变得前所未有地重要。据多家媒体报道，Anthropic的部分前沿模型在2026年6月中旬因美国政府出口管制要求而对特定地区限制访问。(来源: 多家科技媒体报道, 2026-06) 这是一个先例：当AI能力达到某个阈值，政府会开始介入访问控制。

JPMorgan的香港员工访问限制，是这个趋势在金融机构层面的具体化。值得注意的是，这是全球主要金融机构中首次公开记录的针对特定地区的AI工具访问限制。它发出了一个信号：AI工具的地理访问限制，正在从政府层面向企业层面传导。

与此同时，Anthropic在2026年6月宣布在首尔开设亚洲新办公室。这个地理选择本身就是一个立场表达——在出口管制压力下，AI公司正在主动重新规划其亚洲布局，选择与美国有紧密安全同盟关系的国家作为扩张优先地。(来源: Anthropic官方公告, 2026-06)

这里出现了一个结构性矛盾：AI自主性能力的提升，在技术层面扩大了AI的应用边界；但在地缘政治层面，它同时触发了更严格的访问控制机制。技术边界在扩张，政治边界在收缩。

对于企业用户而言，这意味着”我能用哪个AI工具”这个问题的答案，正在变得越来越依赖于用户的地理位置、所在机构的监管属地，以及AI提供商的政治合规状态——而不仅仅是技术能力本身。

Anthropic在其2026年提交的S-1招股书中，将”政府监管行动导致服务中断”列为核心风险因素之一。(来源: Anthropic S-1 Filing, SEC EDGAR, 2026) 这个风险的现实化速度，似乎比大多数投资者预期的要快。对比之下，OpenAI在2024年选择退出中国市场，Meta的Llama系列因开源属性在出口管制问题上面临不同的法律框架。不同的商业模式和分发策略，正在产生截然不同的地缘政治风险暴露。

两种对立的解读与我的判断

对于Project Fetch Phase 2所代表的具身AI自主性突破，存在两种尖锐对立的解读框架。

解读A：临界事件论。 这种观点认为，Phase 2标志着AI自主性从”辅助工具”到”自主执行者”的质变临界点。37倍的速度优势、10个月内从”无法独立完成”到”基本独立完成”的跨越、三阶段演化模式在物理世界的首次显现——这些都是质变信号，而非量变积累。接下来的12-24个月，具身AI自主化将在结构化物理任务中加速渗透，先从仓储物流开始，然后向工厂、农业、建筑延伸。持这一观点的包括部分风险投资人和AI乐观主义者，他们将Phase 2类比为2012年AlexNet在ImageNet上的突破——一个标志着新范式开始的里程碑事件。

解读B：局限性论。 这种观点认为，Phase 2的意义被过度解读。robodog是商业四足机器人，实验环境是受控仓库，任务是结构化的。”无法抓取海滩球”这个失败案例揭示了一个根本性的能力鸿沟：真实物理世界的复杂性远超实验室场景，低层次运动控制的突破需要的不是更好的语言模型，而是完全不同的技术路径（如大规模物理模拟训练）。Phase 2不是质变，而是一个在高度受限条件下的量变数据点。持这一观点的包括部分机器人学研究者和工业自动化从业者，他们指出从实验室demo到工厂部署之间存在巨大的工程化鸿沟——环境不确定性、硬件可靠性、长期运行稳定性，这些问题在一份研究报告中是不可见的。

第三种视角：系统集成论。 还有一种较少被讨论但同样重要的观点：Phase 2的真正意义不在于Claude Opus 4.7本身的能力，而在于它证明了”通用语言模型 + 标准化硬件接口 + Agent基础设施”这个系统组合的可行性。在这个视角下，关键突破不是任何单一组件的进步，而是组件之间互操作性的成熟。这意味着，未来的具身AI自主化不需要等待某个单一技术的”银弹式突破”，而是可以通过系统集成的持续优化来推进。

我的判断：解读A和解读B都是正确的，但它们在讨论不同层次的问题，而系统集成论提供了最具操作性的分析框架。

解读B的批评是技术层面的，它正确地指出了当前AI自主性的真实边界。但解读B的错误在于，它用”不完整”来否定”重要性”——一项技术不需要解决所有问题才能产生颠覆性影响，它只需要解决足够多的结构化任务就可以了。iPhone在2007年发布时，其摄像头、电池续航、网络速度都远不如当时的专业设备，但它重新定义了”足够好”的标准。

解读A的兴奋是商业层面的，它正确地识别了这个能力突破对特定行业的冲击速度。但解读A的风险在于，它容易忽略从”实验室成功”到”大规模部署”之间的工程化鸿沟——可靠性、安全性、成本、维护，这些因素在实验报告中通常是不可见的。Waymo从2009年开始测试到2020年才在凤凰城有限区域开放无人驾驶服务，中间经历了11年的工程化过程。

真正重要的不是Phase 2本身，而是它所揭示的演化速度。 从Phase 1到Phase 2，10个月。从”网络安全领域出现三阶段模式”到”物理世界出现同样模式”，时间跨度可能不超过18个月。这个跨域传播速度，才是衡量AI自主化真实进展的核心指标。

基础设施与能力的协同成熟：一个被忽略的时间锁

AgentCore Harness的GA与Project Fetch Phase 2的同日发布，在时间上可能是巧合，但在逻辑上揭示了一个关键的协同关系：AI自主性能力的实际落地，需要能力层与基础设施层的同步成熟。

回顾移动互联网的发展历史：iPhone 3G（2008年）的计算能力（能力层）和3G/4G网络的逐步铺开（基础设施层）大约在同一时期成熟，这两者的协同是移动应用爆发的必要条件。App Store在2008年上线时只有500个应用，到2010年4G开始部署时已有超过30万个。如果只有智能手机而没有高速网络，应用生态不会繁荣；如果只有高速网络而没有足够强大的智能手机，网络带宽无法被充分利用。

AI自主化正在经历类似的协同成熟过程。Claude Opus 4.7的自主执行能力（能力层）需要隔离运行环境、持久化记忆、工具调用框架、可观测性基础设施（基础设施层）来支撑才能真正落地到生产环境。AgentCore Harness提供的，正是这套基础设施层。

这个协同成熟的时间窗口，是判断”AI自主化何时从实验室走向规模化部署”的关键变量。当能力层和基础设施层都达到生产就绪状态时，就是规模化部署开始的时间点。

AgentCore Harness在2026年4月进入Preview、6月18日正式GA，这个时间线意味着AWS认为当前的Agent基础设施已经达到了生产就绪的标准。与此同时，Project Fetch Phase 2证明了在受控条件下AI自主执行能力已经成熟。两层同步，时间窗口正在打开。

然而，有一个重要的caveat：AWS在构建Agent基础设施时，有意保持了对多个AI提供商的兼容性——开发者可以在Anthropic Claude、Amazon Nova、Meta Llama等不同模型之间切换，而不丢失Agent的运行状态和上下文。这与Microsoft Azure”Runtime免费”的策略形成了对比：Azure用零成本换取生态锁定（主要绑定OpenAI模型），AWS用多提供商兼容性换取更广泛的客户基础。

这两种策略背后，是两种不同的对AI提供商市场格局的判断：Azure在押注OpenAI的持续技术领先地位，AWS在押注AI提供商市场的持续分散化和竞争。从2025-2026年的市场演变来看，Anthropic Claude、Google Gemini、Meta Llama、Mistral等模型在不同任务维度上各有优势，市场格局确实在走向多元化而非赢者通吃。AWS的多提供商策略在这个趋势下似乎更具前瞻性。

对不同受众的含义

对工业机器人和物流行业：

Project Fetch Phase 2的直接含义是，AI辅助的机器人控制系统在结构化任务上的部署可行性已经大幅提升。”研究员只需进行最小化的物理准备和指令输入”这个操作模式，如果能在真实工业环境中复现，意味着机器人操控的技能门槛将大幅下降——不再需要专业的机器人工程师全程参与，而是任何能够描述任务目标的人都可以操控机器人完成结构化任务。

这对劳动力市场的含义是显而易见的，但更微妙的影响在于：它改变了机器人部署的经济学。根据International Federation of Robotics（IFR）2024年报告，全球工业机器人部署的总拥有成本中，编程和集成费用通常占到初始硬件成本的3-5倍。如果AI自主化能够将编程和调试成本压缩到接近于零，机器人部署的ROI将发生结构性改变。截至本文发布时，尚无公开数据量化Phase 2技术路径在工业场景中的具体成本节约，但方向性的逻辑是清晰的。

对AI基础设施投资者：

AgentCore Harness GA标志着Agent基础设施市场进入竞争性规模化阶段。当AWS、Azure、Google三大云厂商都在大力投入Agent运行时基础设施时，这个市场的规格和标准正在快速固化。对于专注于Agent基础设施的独立厂商（如LangChain、CrewAI、AutoGen等），这既是市场验证，也是竞争压力——云厂商的入场通常意味着独立厂商需要向更高层次的差异化迁移，或者被收购整合。

对企业IT决策者：

JPMorgan香港事件发出的信号是：AI工具的访问控制正在变成一个地缘政治变量，而不仅仅是技术或合规变量。企业在选择AI工具时，需要将提供商的政治合规风险纳入评估框架。具体建议：（1）评估AI提供商在不同司法管辖区的服务连续性承诺；（2）建立多提供商冗余策略，避免对单一AI供应商的过度依赖；（3）关注开源模型（如Meta Llama系列）作为地缘政治风险的对冲选项。

对Anthropic作为公司：

Project Fetch Phase 2是一个强有力的能力证明，但它同时也在加速一个困境的浮现：当AI自主性能力越强，它越容易触发监管关注和地缘政治介入。Anthropic正在同时面对两个方向的压力——投资者和客户希望它更快地商业化自主性能力（据报道Anthropic 2026年年化收入已超过20亿美元），政府希望它更严格地控制这种能力的传播。这两个压力方向在当前的地缘政治环境下，很难同时满足。

结语：真正的临界点不是速度，而是角色反转

Project Fetch Phase 2最深刻的意义，不在于37倍的速度数字，而在于角色的转变。

在Phase 1中，Claude是人类的助手——它帮助人类更快地完成任务，但人类始终是主导者，是决策者，是问题的解决者。在Phase 2中，这个关系发生了逆转：人类成为了AI系统的启动者和监督者，而AI成为了任务的实际执行者和决策者。

这个角色转变，是具身AI自主性演化的真正临界点。

当然，这个临界点目前只在受控实验室环境、结构化任务、商业四足机器人这个高度特定的场景中成立。它距离”机器人完全取代人类体力劳动”还有漫长的路要走——正如AlexNet在2012年证明了深度学习的可行性，但自动驾驶汽车在2026年仍未实现完全无人化。

但三阶段演化模式的历史记录告诉我们：一旦某个领域的AI自主性跨越了第三阶段的门槛，它的扩散速度通常会超出预期。网络安全领域是第一个案例，物理世界的Project Fetch是第二个。

下一个跨越第三阶段的领域，会是哪里？

基于三阶段模式的跨域传播规律，我的判断是：最可能的下一个领域是实验室自动化——特别是生物实验室中的高通量筛选和样品处理。这类任务具备Phase 2成功所需的全部特征：高度结构化、有明确的成功标准、硬件接口标准化程度高、错误可以被快速检测。Emerald Cloud Lab和Strateos等公司已经在构建这个方向的基础设施。

这个问题的答案，比Project Fetch Phase 2本身更值得持续追踪。因为它将告诉我们，AI自主性的扩散是遵循可预测的模式，还是会在某个意想不到的领域突然爆发。

参考资料

Project Fetch Phase 2: Robotic Control with Claude — Anthropic Research, 2026-06-18
Project Fetch: Robot Dog Experiments with Claude — Anthropic Research, 2025-08-01
Amazon Bedrock AgentCore Harness is now Generally Available — AWS Machine Learning Blog (Kosti Vasilakakis, Alexander Richey, Evandro Franco, Vivek Dalal), 2026-06-18
JPMorgan Chase cuts off Anthropic access to its Hong Kong staff — Reuters / Financial Times, 2026-06-18
Anthropic S-1 Registration Statement — SEC EDGAR, 2026
World Robotics 2024 Report — International Federation of Robotics, 2024
Anthropic首尔办公室开设公告 — 来源: Anthropic官方公告, 2026-06-17
Azure AI Foundry Agent Service Runtime免费策略 — 来源: Microsoft Azure Blog, 2026-03

主题分类：模型能力与技术突破