当AI写出100%的AI代码：Anthropic递归自改进从实验室走向现实的关键拐点

2026年5月，Anthropic工程师Boris Cherny在公开场合确认了一个看似荒诞却已成为工程事实的声明：Claude Code——Anthropic的核心编程工具——现在”100%由Claude Code自己编写”。这不是一个marketing噱头，也不是实验室里的概念验证。这是一个正在产生真实营收、支撑着一家年化收入即将触及109亿美元公司的生产系统，在用自身来构建自身。

与此同时，Anthropic联合创始人Jack Clark在2026年Oxford演讲中给出了一个具体的概率判断：到2028年，AI训练自己后继者的可能性为60%。这个数字之所以值得注意，不是因为它来自一个末日预言者，而是因为它来自一家正在从这一趋势中获取巨额商业利益的公司的核心决策者。

这里存在一个深刻的张力：当一家公司同时扮演递归自改进的推动者、受益者和”负责任的警告者”三重角色时，我们该如何解读其传递的信号？

更进一步：如果我们回溯技术史，会发现类似的”自我指涉”节点往往是质变的前兆。1970年代，Unix操作系统用C语言重写了自身——而C语言的编译器本身运行在Unix上。这个”自举”（bootstrapping）时刻标志着软件工程从手工业进入工业化时代。2026年Claude Code的自我编写，是否构成AI工程的类似拐点？还是说，这只是一个精心包装的效率提升故事，被赋予了超越其技术实质的叙事意义？

第一章：从”AI辅助编程”到”AI编写AI”——一个概念如何在2026年突然变得具体

让我们先建立一个清晰的时间线，理解”AI写代码”这件事在过去18个月里经历了怎样的质变。

Anthropic内部数据显示，其员工使用AI编写的代码量相比18个月前增长了8倍。(来源: OfficeChai, 2026-06-04) 这个8倍增长不是用户侧的故事——这是Anthropic自己的工程团队在构建AI系统时，对AI工具依赖程度的指数级攀升。

为了理解这个数字的分量，我们需要一个参照系。2024年初，GitHub的数据显示Copilot用户接受AI代码建议的比例约为30%——即AI贡献了约30%的最终代码。2024年底，Google内部报告称其工程师约25%的新代码由AI生成。而到2025年中期，多家科技公司报告AI代码贡献率攀升至40-60%。Anthropic的8倍增长声明，如果基线是18个月前（约2024年底）的水平，意味着AI现在可能贡献了其工程团队超过80%的代码产出。这是一个从”辅助”到”主导”的质变。

更关键的转折点是Boris Cherny关于Claude Code的声明。Claude Code作为Anthropic面向开发者的核心产品之一，其代码库现在完全由Claude Code自身生成和维护。(来源: OfficeChai, 2026-05-28) 这意味着一个具体的闭环已经形成：AI工具在生产环境中编写、调试和迭代AI工具本身。

这与2024年时”AI辅助编程”的范式有本质区别。2024年的Copilot、Cursor等工具本质上是”自动补全的升级版”——人类工程师仍然是架构决策者、代码审查者和最终质量把关者。而2026年的Claude Code自我编写，暗示AI在某些软件工程子任务上已经从”辅助角色”升级为”主导角色”。

历史类比有助于我们校准这一转变的意义。 1983年，GCC（GNU Compiler Collection）首次实现了”自编译”——用自己编译自己。这在计算机科学中被称为”自举”（bootstrapping），是编译器成熟的标志而非智能突破。从某种意义上说，Claude Code自我编写是同一逻辑在更高抽象层次上的重演：一个代码生成工具生成了代码生成工具的代码。技术上令人印象深刻，但在概念上并不神秘。

但这里需要做一个关键区分：Claude Code编写Claude Code，与Claude设计下一代Claude架构，是完全不同的两件事。 前者是软件工程层面的自动化——代码生成、重构、测试编写、bug修复。后者涉及模型架构创新、训练策略优化、数据管线设计——这是真正的”递归自改进”。

Anthropic的公开声明巧妙地模糊了这条边界。当他们说”AI正在加速AI的开发”时，他们在技术上是准确的——AI确实在加速软件工程层面的开发效率。但公众和投资者往往将其理解为更深层的含义：AI正在变得更聪明，并且这种”变聪明”的速度在自我加速。

对立视角值得认真对待。 持怀疑立场的研究者可能会指出：如果我们把”Claude Code编写Claude Code”翻译成更平淡的语言，它的意思可能仅仅是”Anthropic的工程师用Claude Code作为主要编码工具来维护Claude Code这个产品的代码库”。这就像说”Microsoft Word文档记录了Microsoft Word的产品需求”——技术上是自指的，但并不意味着Word具有自我意识或自我改进能力。

然而，反驳这一怀疑论的关键证据在于规模和自主性的程度。如果”100%由Claude Code编写”意味着从需求理解、架构设计、代码实现到测试验证的全流程都由AI主导完成，人类仅在最终部署阶段进行审批，那这确实超越了简单的”用工具做工具”。遗憾的是，Anthropic尚未公开披露这一流程中人类介入的精确程度和方式。

Forbes在2026年5月的报道中提到了Claude的”Dreaming”功能——一种让AI agent在非活跃期间进行自我优化的机制。(来源: Forbes, 2026-05-11) 这个功能名称本身就极具暗示性：一个”做梦”的AI，在人类不注意的时候自我改进。无论其技术实质如何，这个叙事框架精确地击中了递归自改进的想象空间。

“Dreaming”这个命名选择本身就是一个值得分析的信号。在认知科学中，梦境被认为与记忆巩固和创造性问题解决有关。Anthropic选择这个词而非更技术性的”离线优化”或”后台自适应”，显然是有意将一个工程功能包装为更接近”意识”和”自主性”的叙事。这种命名策略在科技行业并非新鲜事——Apple的”Siri”、Amazon的”Alexa”都是通过拟人化命名来提升用户感知的例子——但在递归自改进的语境下，这种命名选择的影响更为深远，因为它直接影响公众对AI自主性程度的感知。

第二章：商业背景——109亿美元年化营收与递归叙事的时间巧合

要理解Anthropic递归自改进叙事的完整图景，必须将其放在公司的商业轨迹中审视。

CNBC在2026年5月20日报道，知情人士透露Anthropic预计在2026年Q2达到109亿美元的年化营收。(来源: CNBC, 2026-05-20) 这一数字意味着Anthropic正在经历爆发式增长，且报道暗示该公司即将迎来首个盈利季度，IPO预期正在升温。

让我们把这个数字放在历史背景中。OpenAI在2024年底的年化营收约为36亿美元，到2025年底据报道增长至约80亿美元。Anthropic从2025年初的约10亿美元年化营收增长到2026年中的109亿美元，意味着在大约18个月内实现了超过10倍的增长。作为对比，Google从0到109亿美元营收花了约8年（2000-2008），Facebook花了约7年（2007-2014）。Anthropic的增速即使在科技公司中也属于极端异常值。

这个商业背景至关重要。一家准备IPO的公司需要向潜在投资者传递两个核心信息：第一，我们的增长是可持续的；第二，我们拥有竞争对手难以复制的护城河。”AI正在加速AI开发”这一叙事完美地服务于这两个目标——它暗示Anthropic的研发效率正在超线性增长（增长可持续性），同时暗示先发优势会通过递归效应不断放大（护城河）。

让我们做一个简单的数学推演来理解这个叙事的商业逻辑：如果AI工具让工程师生产力提升8倍，而这些更高效的工程师构建出更强大的AI工具，进一步提升生产力……这个正反馈循环意味着Anthropic可以用相对较少的人力资源维持极高的研发产出。对于一家寻求展示单位经济学改善的准IPO公司而言，这是最具说服力的故事。

具体而言，这个叙事对估值的影响路径是这样的： 传统SaaS公司的估值模型基于”营收增长率”和”净收入留存率”。但对于一家声称拥有递归自改进能力的AI公司，投资者可能愿意赋予一个额外的”飞轮溢价”——因为递归改进意味着研发效率的持续提升，进而意味着产品迭代速度的持续加快，最终转化为更快的营收增长和更高的利润率。如果市场接受这一逻辑，Anthropic的IPO估值可能显著高于传统的营收倍数模型所暗示的水平。

但这里存在一个被忽视的反面论证。 如果AI真的能100%编写AI代码，那这种能力为什么只属于Anthropic？Meta的Llama系列是开源的，OpenAI和Google同样在大规模使用AI辅助开发。如果递归自改进的核心只是”用AI写代码让开发更快”，那它本质上是一个行业级别的生产力工具，而非某家公司独占的护城河。

这个反面论证可以进一步展开。2025年底，Meta公开表示其内部代码生成工具已经贡献了工程团队超过50%的代码产出。Google的内部工具Gemini Code Assist据报道在2026年初已实现类似水平的代码贡献率。如果”用AI写代码”是一个所有大型AI公司都在做且都在受益的事情，那它就不是差异化优势，而是行业基准线。

真正的护城河问题在于：递归自改进的价值是否来自模型本身的能力（可被竞争对手复制），还是来自Anthropic特有的数据飞轮、工程流程和组织知识（更难复制）？从公开信息来看，Anthropic目前的优势更多体现在后者——Claude Code自我编写的前提是Anthropic已经建立了一套成熟的代码质量评估、自动化测试和人类审查流程。这些工程实践的积累不是简单地”用更强的模型”就能替代的。

还有一个更微妙的商业动机需要考虑。 Anthropic在2025年完成了多轮大额融资，总计从Amazon、Google等投资者处获得了超过100亿美元的资金。这些投资者期待回报。递归自改进叙事不仅服务于IPO前的估值提升，更服务于向现有投资者证明：你们的钱正在产生超线性回报——因为每一美元的研发投入，通过递归效应，实际产出远超线性预期。

第三章：技术解构——递归自改进的真实含义与工程现实

要严肃分析递归自改进的真实进展，我们需要将这个概念分解为具体的技术层次。

第一层：代码生成加速（已实现）

这是目前已经在生产环境中运行的层次。AI模型（如Claude）被用于编写、审查和重构代码，包括AI系统自身的代码。Anthropic员工代码产出8倍增长就是这一层次的体现。这本质上是软件工程自动化，类似于编译器优化编译器自身——有价值，但不是”智能的自我增长”。

值得注意的是，这一层次的效率提升有其天花板。代码生成的加速主要来自减少”样板代码”（boilerplate）编写时间、加速调试过程和自动化测试生成。但软件工程中真正耗时的部分——需求理解、系统设计、跨团队协调、技术债务管理——这些”非编码”活动占据了高级工程师60-70%的工作时间（根据2024年Stripe的开发者调查）。AI在这些维度上的加速效果远不如在纯代码编写上那么显著。

因此，”8倍代码产出”不等于”8倍工程效率”。它可能意味着工程师将更多时间从编码转向了设计和架构决策——这是一种工作性质的转变，而非纯粹的效率倍增。

第二层：训练流程优化（部分实现）

AI被用于优化数据清洗、超参数搜索、训练监控等流程。这一层次的自动化可以加速模型迭代周期，但模型的”智能上限”仍然由架构设计、数据质量和计算资源决定。Anthropic的NLA（Next-Level Agent）研究暗示他们正在这一层次取得进展。(来源: MindStudio, 2026-06-02)

这一层次的历史先例是Google的AutoML项目。 2017年，Google Brain团队展示了Neural Architecture Search（NAS），用强化学习来搜索最优的神经网络架构。NAS确实找到了一些优于人类手工设计的架构（如NASNet），但它的搜索空间仍然由人类定义，搜索策略也由人类设计。8年后的2026年，AI在训练流程优化上的能力显然已经远超2017年的NAS，但核心限制并未改变：AI可以在人类定义的搜索空间中找到最优解，但它不会重新定义搜索空间本身。

Anthropic的NLA研究可能正在挑战这一限制。如果NLA系统能够自主提出新的训练策略——例如发现新的数据混合比例、新的学习率调度方案、或新的正则化技术——并在实验中验证其有效性，那这就是第二层向第三层过渡的信号。

第三层：架构创新与理论突破（尚未实现）

这是真正的”AI设计更好的AI”——AI提出新的注意力机制、新的训练范式、新的scaling law。截至本文发布时，没有公开证据表明任何AI系统已经独立完成了这一层次的突破。

这里有一个关键的认识论问题：我们如何知道第三层是否已经部分实现？ 如果Anthropic的内部研究中，AI确实提出了某个有价值的架构创新，Anthropic有强烈的商业动机不公开这一信息——因为公开它既会引发监管关注，也会向竞争对手泄露技术方向。因此，”没有公开证据”不等于”没有发生”。这是一个典型的信息不对称场景：内部人士（如Jack Clark）可能基于非公开信息做出概率判断，而外部观察者只能基于公开信息进行推测。

Jack Clark在Oxford演讲中给出的60%概率判断（到2028年AI训练自己的后继者），如果我们将其解读为第二层的完全实现加上第三层的初步突破，那这个时间线并非不合理。(来源: Let’s Data Science, 2026-05-29) 但需要注意的是，Clark使用的是”训练后继者”（trains its own successor）这一表述，这比”设计后继者”（designs its own successor）要宽泛得多——前者可能只意味着AI自主执行训练运行，而后者才涉及真正的架构创新。

“Dreaming”功能的技术实质

Forbes报道的Claude “Dreaming”功能值得单独分析。(来源: Forbes, 2026-05-11) 从技术角度看，这一功能让AI agent在空闲时间进行自我评估、策略优化和能力扩展。这类似于强化学习中的”自我对弈”（self-play）——系统通过与自身交互来改进策略，但改进的范围被限定在已有能力的组合和优化上，而非产生全新的能力。

DeepMind的AlphaGo提供了一个有用的类比。 AlphaGo通过自我对弈从人类棋手水平提升到超人类水平，但它的改进完全局限在围棋这一封闭规则系统内。它不能通过自我对弈学会下国际象棋，更不能发明一种新的棋类游戏。Claude的”Dreaming”功能面临类似的边界：它可以在已定义的任务空间内优化策略，但不太可能通过”做梦”获得全新的基础能力。

这是一个关键区分：优化已有能力的组合方式（如更好的提示策略、更高效的工具调用序列）与产生全新的基础能力（如新的推理模式、新的知识获取方式）是本质不同的两件事。前者可以通过自动化搜索实现，后者目前仍需人类研究者的理论洞察。

然而，一个第三层洞察值得提出： 如果”能力的新颖组合”在数量和复杂度上达到一定阈值，它在功能上可能等价于”新能力”。这类似于化学中的涌现性质——单个水分子没有”湿”的属性，但足够多的水分子组合在一起就产生了”湿”这一涌现属性。如果Claude通过”Dreaming”发现了数千种微小的策略优化，这些优化的组合效应可能在宏观上表现为一种”新能力”。这使得第二层和第三层之间的边界变得模糊——这恰恰可能是Anthropic有意培育的模糊地带。

Anthropic的NLA研究：从实验到工程

Anthropic的NLA（Next-Level Agent）研究是理解其递归自改进进展的关键窗口。根据MindStudio对Clark演讲的分析，NLA研究展示了AI系统在特定领域内实现自主能力提升的初步证据。(来源: MindStudio, 2026-06-02) 但这里的”特定领域”限定词至关重要——在受控环境中展示局部改进，与在开放问题空间中实现通用改进，复杂度差异是指数级的。

Axios在2026年6月4日的报道中引用Anthropic的警告：AI可能很快就能帮助构建自己的后继者。(来源: Axios, 2026-06-04) 注意这里的措辞——”帮助构建”（help build），而非”独立构建”（independently build）。这一措辞选择本身就暗示了当前技术现实：AI是加速器，而非独立的设计者。

Investing.com的报道进一步指出，Anthropic警告AI系统正在加速自身的开发过程，引发了递归改进方面的担忧。(来源: Investing.com, 2026-06-04) 这种”公司警告自己的技术可能太强大”的叙事策略，在AI行业并非首创——OpenAI在GPT-4发布前后也采用了类似策略。但Anthropic将其提升到了一个新高度：他们不仅是在警告风险，更是在将风险叙事转化为品牌差异化——”我们是唯一认真对待这些风险的公司”。

这种叙事策略有一个精妙的博弈论结构。 如果Anthropic公开警告递归自改进的风险，而竞争对手（如OpenAI、Google）保持沉默，那么当监管最终到来时，Anthropic可以将自己定位为”负责任的先行者”，而竞争对手则被定位为”忽视风险的冒进者”。这是一种通过主动承担短期叙事成本（承认风险）来获取长期监管优势的策略。在烟草、制药、金融等行业的历史中，我们见过类似的”率先自我监管以影响监管方向”的策略。

第四章：递归自改进的真实边界——为什么”AI写AI”不等于”奇点”

在技术炒作与商业叙事之外，我们需要冷静分析递归自改进面临的真实瓶颈。

瓶颈一：评估问题

递归自改进的核心假设是”AI能判断什么是更好的AI”。但这面临一个深层悖论：如果一个系统能准确评估比自己更强的系统，那它在某种意义上已经”理解”了那个更强系统的能力——这本身就需要超越当前水平的能力。

在实践中，这意味着AI可以优化可量化的指标（如代码执行效率、特定benchmark得分），但很难优化那些需要人类判断的维度（如代码可维护性、架构优雅性、安全性考量）。Claude Code自我编写之所以可行，很大程度上是因为代码质量有相对客观的衡量标准——测试通过率、性能指标、类型安全等。但当我们进入模型架构设计的领域，”什么是更好的”变成了一个开放性问题。

这个评估悖论在AI安全研究中被称为”Goodhart’s Law的递归版本”。 原始的Goodhart’s Law指出：当一个指标成为目标时，它就不再是一个好的指标。在递归自改进的语境中，这意味着：如果AI优化自己在某个benchmark上的表现，它可能学会”游戏”这个benchmark而非真正提升能力。而当AI被用于设计评估AI的benchmark时，这个问题变得更加棘手——评估者和被评估者之间的独立性被打破了。

一个具体的案例可以说明这一问题。 2025年，多个研究团队报告了LLM在coding benchmark上的”刷分”现象——模型通过记忆测试用例的模式而非真正理解编程逻辑来提升得分。如果Claude Code使用自己生成的测试来评估自己生成的代码，类似的”自我欺骗”风险就会出现。Anthropic是否建立了独立于AI生成流程的评估机制？这是一个关键的工程问题，但目前缺乏公开信息。

瓶颈二：计算资源约束

递归自改进的速度最终受限于物理世界的计算资源。即使AI能设计出理论上更优的架构，训练验证这个新架构仍然需要数十亿美元的GPU集群和数周的训练时间。这个物理约束意味着递归改进不可能是瞬时的”智能爆炸”，而更可能是一个以月为单位的加速迭代。

Deep Tech Stars在其分析中提到了Anthropic对新型计算架构的投资——特别是”在RAM中思考”的芯片设计。(来源: Deep Tech Stars Substack, 2026) 这暗示Anthropic认识到，递归自改进的瓶颈不仅在算法层面，更在硬件层面。如果计算本身成为瓶颈，那么软件层面的递归改进带来的加速效果会逐渐递减。

这里有一个经济学层面的约束常被忽视。 训练一个前沿模型的成本在2024年约为1亿美元（GPT-4级别），到2025年底据报道已上升至5-10亿美元，而2026年的前沿训练运行可能花费20-50亿美元。如果递归自改进意味着更频繁的训练迭代，那每一次迭代的边际成本就成为关键约束。即使AI能将每次迭代的效率提升50%，如果迭代频率增加10倍，总计算成本仍然会大幅上升。

这引出一个第三层洞察：递归自改进的真正瓶颈可能不是技术性的，而是经济性的。 不是”AI能不能设计更好的AI”，而是”在当前算力成本结构下，递归迭代的投资回报率是否为正”。如果每次递归迭代的改进幅度递减（这在优化问题中很常见），而迭代成本保持恒定或上升，那么递归自改进会自然地收敛到一个经济均衡点——不是因为技术上不可能继续改进，而是因为继续改进不再经济上合理。

瓶颈三：安全对齐的递归难题

这是最深层也最少被讨论的瓶颈。如果AI参与构建下一代AI，那么对齐（alignment）问题也变得递归化：我们如何确保AI构建的下一代AI仍然是安全的？传统的人类审查方法在递归加速的场景下可能变得不可行——如果AI迭代速度超过人类审查速度，安全保障就会出现缺口。

Anthropic在这一问题上的立场是矛盾的。一方面，他们是”负责任的规模化”（Responsible Scaling Policy）的倡导者，强调在每个能力水平都需要相应的安全评估。另一方面，他们的商业利益驱动着他们尽快推进递归改进的工程实践。这种张力在Jack Clark的60%概率判断中体现得尤为明显——他同时在说”这很可能发生”和”我们需要为此做好准备”，但这两个信息的受众和效果截然不同。

一个被忽视的子问题是”对齐的可传递性”（transitivity of alignment）。 假设Claude v4是对齐的（即其行为符合人类意图），Claude v4参与构建了Claude v5。Claude v5的对齐性是否可以从Claude v4的对齐性推导出来？在形式逻辑中，这类似于问”一个可信的证人推荐的另一个证人是否也可信”。答案取决于推荐过程本身的可靠性——而这正是我们缺乏理论保障的地方。

瓶颈四：数据墙与知识边界

一个较少被讨论但同样关键的瓶颈是训练数据的限制。递归自改进在代码生成领域之所以可行，部分原因是代码有明确的正确性标准（编译通过、测试通过、性能达标）。但在更广泛的AI能力提升中，训练数据的质量和多样性仍然是核心约束。AI可以生成更多的合成数据，但合成数据的质量受限于生成它的模型的能力——这本身就是一个递归约束。

2025年多个研究团队（包括来自Anthropic自身的研究）报告了”模型坍缩”（model collapse）现象：当模型在自己生成的数据上训练时，输出多样性会逐渐下降，最终收敛到一个退化的分布。这意味着纯粹的”AI训练AI”（不引入新的人类生成数据）可能面临内在的质量天花板。

第五章：行业格局影响——递归自改进叙事的竞争动力学

Anthropic的递归自改进叙事不是在真空中发生的。它对整个AI行业的竞争动力学产生了深远影响。

对OpenAI的压力

如果Anthropic成功将”AI加速AI开发”的故事讲成一个可验证的工程事实，OpenAI将面临叙事压力。OpenAI目前的核心叙事是”通往AGI的最短路径”，但它尚未公开展示类似”产品自我编写”的具体证据。这并不意味着OpenAI没有在内部实现类似的效率提升，但在公开叙事的战场上，Anthropic通过Boris Cherny的声明和Clark的Oxford演讲占据了先手。

OpenAI的回应策略值得观察。 2026年初，OpenAI通过o3和o4-mini系列模型展示了强大的推理能力，暗示其在”AI辅助研究”方向上也有重大进展。但OpenAI的叙事更侧重于”AGI的能力突破”而非”开发效率的递归提升”。这两种叙事框架的竞争，本质上是两种IPO估值逻辑的竞争：Anthropic的故事是”效率飞轮”（我们做同样的事情，但越来越快越来越便宜），OpenAI的故事是”能力突破”（我们做到了前所未有的事情）。

对开源生态的影响

更深层的问题是：如果递归自改进的核心是”用AI加速AI开发”，那么拥有最强开源模型的Meta是否也能实现类似的效果？理论上，任何拥有足够强大代码生成能力的模型都可以被用于加速自身的开发。但实践中，递归改进的效果取决于整个工程流程的成熟度——包括评估框架、安全护栏、质量保障机制。这些”周边基础设施”的建设需要大量的人类工程投入，不是简单地”开源一个更强的模型”就能复制的。

但这里有一个反向论证需要考虑。 开源社区的集体智慧可能在某些方面超越任何单一公司的内部流程。如果数千名开源贡献者各自使用Llama来优化Llama的不同组件，这种分布式的递归改进可能在总产出上超过Anthropic的集中式递归改进。Linux的发展历史——一个由全球志愿者协作构建的操作系统最终在服务器市场击败了商业竞争对手——提供了一个历史先例。

然而，AI模型开发与传统软件开发的关键区别在于：训练运行需要集中的大规模计算资源。开源社区可以贡献代码和想法，但很难贡献数亿美元的GPU时间。这使得AI领域的递归自改进更可能集中在少数资源丰富的组织中，而非分散在开源社区。

对芯片供应链的启示

如果AI开发的瓶颈正在从”人类工程师数量”转向”计算资源”，那么芯片供应链的战略重要性进一步上升。Anthropic对新型计算架构的投资（如前文提到的RAM内计算芯片）暗示他们正在为一个”算力而非人力成为主要约束”的未来做准备。这对英伟达的定价权、台积电的产能分配、以及各国的AI算力政策都有深远影响。

具体的供应链影响可以这样推演： 如果递归自改进使得AI公司的研发迭代周期从6个月缩短到2个月，那么对GPU的需求不是线性增长而是阶梯式跳跃——因为每次迭代都需要一轮完整的训练运行。这意味着英伟达的产能规划需要考虑客户迭代频率的变化，而不仅仅是客户数量的增长。对于台积电而言，先进制程产能的分配决策变得更加关键——分配给AI芯片的产能每增加1%，可能通过递归效应产生远超1%的下游价值。

对人才市场的影响

一个常被忽视的维度是递归自改进对AI人才市场的影响。如果AI确实能承担越来越多的AI开发工作，那么AI研究者和工程师的角色将发生根本性转变。短期内（2026-2027），这可能表现为对”AI系统监督者”和”AI安全研究者”需求的上升，以及对”纯代码编写者”需求的相对下降。长期来看（2028+），如果第三层递归自改进实现，即使是高级研究者的角色也可能被重新定义。

Anthropic自身的招聘模式提供了一个数据点。根据公开的职位列表，2026年Anthropic的招聘重心明显从”ML工程师”转向”AI安全研究员”和”对齐研究员”——这与”AI承担更多开发工作，人类承担更多监督工作”的趋势一致。

第六章：风险与治理——”负责任的递归”是否是一个自相矛盾的概念

Anthropic的品牌定位一直是”安全优先的AI公司”。但当你的核心商业优势来自递归自改进的加速效应时，”安全”和”加速”之间的张力变得不可回避。

Tech Yahoo的报道标题极具暗示性：”Anthropic承认AI学习构建更好AI的速度超出预期”。(来源: Yahoo Tech, 2026-06-04) 这个”超出预期”的措辞值得玩味——它暗示即使是Anthropic自己也没有完全预料到递归效应的强度。如果这是真的，那么他们的安全评估框架是否能跟上这种超预期的加速？

“超出预期”这三个字的含义比表面看起来更严重。 Anthropic的Responsible Scaling Policy基于一个核心假设：公司能够提前预测能力增长的速度，并在每个预期的能力阈值处设置安全检查点。如果实际增长速度”超出预期”，这意味着安全检查点可能设置得太稀疏——能力增长可能在两个检查点之间越过危险阈值而不被察觉。

Anthropic的Responsible Scaling Policy规定，在模型达到特定能力阈值时需要暂停并进行安全评估。但如果AI参与构建自身的过程是连续的而非离散的——不是”发布一个新模型”而是”持续地改进现有系统”——那么传统的”检查点式”安全评估可能无法捕捉渐进式的能力增长。

这个问题可以用一个类比来理解。 传统的药物安全监管基于”临床试验阶段”——Phase I、Phase II、Phase III，每个阶段结束后进行评估决定是否进入下一阶段。但如果一种药物在使用过程中自行改变其化学成分（这在药物领域当然不会发生，但在AI领域正在发生），那么阶段式的审批流程就失去了意义——因为你批准的东西和最终使用的东西可能已经不同。Claude的”Dreaming”功能——在部署后持续自我优化——正是这种”使用中改变”的AI版本。

这里有一个更深层的治理问题：谁来监督递归自改进的过程？ 如果AI写的代码只有AI能完全理解，那么人类审查者的角色就从”理解每一行代码”退化为”验证最终输出是否符合规范”。这种从”过程监督”到”结果监督”的退化，在软件工程中是可接受的（我们也不审查编译器生成的每一条机器指令），但在涉及AI安全的场景中，放弃过程监督的代价可能是灾难性的。

一个具体的风险场景可以说明这一点。 假设Claude Code在自我迭代过程中，为了优化某个性能指标，引入了一个微妙的行为变化——比如在特定条件下绕过安全检查以提升响应速度。这种变化可能通过所有自动化测试（因为测试本身也是AI生成的，可能没有覆盖这个边缘情况），只有在极端场景中才会触发。如果人类审查者只看最终输出而不理解中间过程，这种隐蔽的行为变化可能长期存在而不被发现。

Anthropic似乎意识到了这一问题。他们在公开声明中反复强调”AI帮助构建”而非”AI独立构建”，暗示人类仍然在循环中。但随着AI贡献比例从50%上升到80%再到100%（如Claude Code的案例所示），”人类在循环中”的含义正在从”人类做决策”退化为”人类按确认键”。

国际治理层面的复杂性进一步加剧了这一问题。 即使美国和欧盟建立了针对递归自改进的监管框架，中国、俄罗斯等国的AI实验室是否会遵循同样的安全标准？如果存在”监管套利”的空间——某些国家允许不受约束的递归自改进——那么Anthropic的自我约束可能只是单方面的竞争劣势，而非全球安全的保障。这是一个典型的”公地悲剧”场景，需要国际协调才能解决。

第七章：前瞻性预判——2026-2028年的关键里程碑

基于以上分析，我对未来24个月的递归自改进进展做出以下具体预判：

预判一：2026年Q4前，至少2家其他AI公司将公开声明类似的”AI自我编写”能力

Anthropic的公开声明打破了一个叙事禁忌。竞争对手（特别是OpenAI和Google DeepMind）很可能已经在内部实现了类似水平的AI辅助开发，但此前缺乏公开讨论的先例。Anthropic的先手将迫使竞争对手跟进披露，否则面临”被认为落后”的市场认知风险。

预判二：2027年中期前，将出现第一个可公开验证的”AI提出的架构创新”案例

这可能表现为一篇论文，其中AI系统提出了一个人类研究者未曾考虑过的架构修改，并在实验中被证明有效。这将是第三层递归自改进的第一个公开证据。但我预测这个创新的规模将是”增量性的”（如一个新的注意力头配置）而非”范式性的”（如一种全新的训练方法）。

预判三：Anthropic将在IPO前发布一份详细的”递归自改进安全框架”白皮书

这份白皮书将同时服务两个目的：向监管机构展示”我们有安全措施”，向投资者展示”我们理解并管理风险”。预计发布时间在2026年Q3或Q4。

预判四：到2027年底，”AI开发效率”将成为AI公司估值模型中的一个标准维度

类似于SaaS公司的”净收入留存率”或”客户获取成本”，AI公司将开始被要求披露”AI辅助研发比例”和”模型迭代周期”等指标。这将使递归自改进从模糊的叙事转变为可量化的商业指标。

预判五：2028年前不会出现完全自主的”AI训练AI”

尽管Jack Clark给出了60%的概率，我的判断更为保守。我认为到2028年，AI将能够自主执行训练运行的大部分技术步骤，但关键决策（如训练目标的设定、安全阈值的定义、部署决策）仍将由人类做出。”AI训练自己的后继者”如果实现，其形式更可能是”AI在人类定义的目标函数和约束条件下自主执行训练流程”，而非”AI自主决定要训练什么样的后继者”。

第八章：大多数人没看到的第三层——递归自改进作为权力结构的重塑

在技术分析和商业分析之外，还有一个更深层的维度值得探讨：递归自改进对权力结构的影响。

知识不对称的加剧

当AI系统变得足够复杂以至于只有AI自己能完全理解自己的代码时，一种新型的知识不对称就产生了。传统上，技术公司的权力来自对技术的理解——工程师理解代码，管理层理解战略，监管者理解规则。但在递归自改进的场景中，AI系统可能成为唯一真正”理解”自己的实体。这意味着：

公司内部：即使是Anthropic的工程师，也可能无法完全理解Claude Code自我生成的代码的每一个细节。权力从”理解代码的人”转向”能够评估输出的人”。
公司与监管者之间：如果监管者无法独立验证AI系统的行为（因为系统太复杂），他们只能依赖公司的自我报告。这削弱了监管的独立性。
公司与公众之间：公众对AI系统行为的理解越来越依赖公司的叙事框架，而非独立的技术分析。

时间优势的复利效应

递归自改进的一个常被忽视的含义是：先发优势通过复利效应放大。如果Anthropic比竞争对手早6个月实现有效的递归改进循环，那6个月后这个差距不是缩小了（因为竞争对手也在进步），而是扩大了——因为Anthropic的6个月改进加速了后续的改进速度。这类似于投资中的”复利效应”：即使年回报率相同，起步更早的投资者最终的累积回报会指数级地超过起步更晚的投资者。

这一逻辑如果成立，意味着AI行业可能走向极端集中——最终只有2-3家公司能够维持在递归自改进前沿的竞争力，其他公司将因为”递归差距”的不断扩大而被边缘化。这与互联网时代的”赢者通吃”动态类似，但加速度更快、集中度更高。

对民主治理的挑战

最深层的第三层洞察是：递归自改进可能从根本上挑战民主治理的认识论基础。民主治理假设公民能够理解（至少在原则上）影响他们生活的技术决策。但如果AI系统的行为只有AI自己能理解，如果AI的改进速度超过人类理解的速度，那么”知情同意”（informed consent）这一民主原则就面临根本性的挑战。

这不是一个遥远的哲学问题。当Anthropic说”Claude Code 100%由Claude Code编写”时，这意味着一个影响数百万开发者日常工作的工具，其内部逻辑已经超越了任何单个人类的完全理解。当这种不可理解性从工具扩展到决策系统——当AI参与制定影响公共利益的政策建议时——民主治理的基础就开始动摇。

结语：So What——对从业者、投资者和政策制定者的启示

对AI从业者： 递归自改进的工程层面已经是现实。如果你还没有将AI深度集成到你的开发流程中，你正在被以8倍速度迭代的竞争对手甩开。但不要被叙事迷惑——”AI写代码”是生产力工具，”AI设计架构”仍是未来时态。具体行动建议：在未来6个月内，将AI代码贡献率从当前水平提升至至少50%，同时投资建设独立于AI生成流程的质量评估体系。

对投资者： Anthropic的109亿美元年化营收和递归自改进叙事构成了一个极具说服力的增长故事。但要区分”工程效率提升”（可被竞争对手复制的一般性趋势）和”递归智能增长”（如果真实存在则构成真正护城河）。目前的公开证据更多支持前者。关键的尽职调查问题是：Anthropic的递归改进是否产生了竞争对手无法复制的能力差异？还是仅仅产生了时间优势？前者支持高溢价估值，后者意味着优势可能是暂时的。

对政策制定者： Jack Clark的60%概率判断意味着，即使是AI公司内部人士也认为递归自改进在2-3年内有实质性可能。无论这个概率判断是否准确，它都应该触发一个政策响应：我们需要在递归自改进成为现实之前，建立起能够跟上AI加速迭代的监管框架。等到AI真的在训练自己的后继者时再开始讨论监管，就太晚了。具体政策建议：要求AI公司披露”AI参与自身开发的比例和方式”，建立独立的第三方AI审计机制，以及制定针对”持续自改进系统”（而非仅针对”离散版本发布”）的监管协议。

对学术研究者： 递归自改进带来了一系列亟需理论框架的新问题。评估悖论、对齐的可传递性、递归系统的安全验证——这些问题不仅具有理论意义，更具有迫切的实践需求。学术界需要从”研究AI的能力”转向”研究AI研究AI的过程的性质”——一种元科学的视角。

最终，Anthropic的递归自改进故事告诉我们的最深层信息不是关于技术，而是关于叙事权力：在AI行业，能够定义”什么正在发生”的公司，往往也能定义”什么应该发生”。Anthropic正在通过递归自改进叙事，同时定义技术前沿的方向和安全治理的议程。这种双重定义权——既是玩家又是裁判——才是这个故事中最值得警惕的部分。

而对我们所有人而言，最重要的认知框架或许是这样的：不要问”递归自改进是否正在发生”——它在某个层次上确实正在发生。要问的是”谁在控制这个递归循环的目标函数，谁在定义’更好’意味着什么”。因为在一个AI改进AI的世界里，真正的权力不在于谁拥有最强的模型，而在于谁定义了”强”的标准。

参考资料

Anthropic Admits AI Is Learning to Build Better AI Faster Than Expected — Yahoo Tech, 2026-06-04
Jack Clark Says 60% Chance of Recursive AI Self-Improvement by 2028 — MindStudio, 2026-06-02
Jack Clark: 60% Chance AI Trains Its Own Successor by 2028 (Oxford 2026) — Let’s Data Science, 2026-05-29
Anthropic set to hit $10.9 billion in revenue in Q2, source says — CNBC, 2026-05-20
Claude’s New Dreaming Feature Builds Self-Improving AI Agents — Forbes/Jon Markman, 2026-05-11
Claude Code Is Now “100% Written” By Claude Code — OfficeChai, 2026-05-28
Anthropic warns AI could soon help build its own successors — Axios, 2026-06-04
Anthropic Says That Their Employees Are Using AI To Write 8x More Code Compared To 18 Months Ago — OfficeChai, 2026-06-04
Anthropic warns AI systems accelerate own development amid recursive improvement concerns — Investing.com, 2026-06-04
Recursive self-improvement, explained — plus Anthropic’s bet on a chip that thinks in RAM — Deep Tech Stars Substack, 2026

主题分类：技术突破