当AI开始设计AI：递归自改进临界点全解析

2026年6月5日，巴黎。

孙正义站在法国总统马克龙身旁，刚刚宣布SoftBank将向法国投入750亿欧元建设AI基础设施。记者追问他对AI发展前景的看法，他给出了一个令在场所有人停顿的答案：

「OpenAI下一代模型，正在由另一个AI模型来设计。」

同一天，数千公里之外，Anthropic的研究团队发布了一份名为《When AI builds itself》的研究报告，描述AI辅助AI开发的当前状态与递归自改进（Recursive Self-Improvement，RSI）的临近轨迹。

这两件事放在同一天发生，绝非策划好的营销动作。它们共同指向了一个让业界持续发烧的问题：AI是否正在接近某个自我进化的临界点？而这个临界点，真的比我们想象的更近吗？

一、孙正义说了什么：第一手信息的分量

孙正义接受CNBC记者采访时，措辞出人意料地直白：

「我和Sam Altman谈过，也和OpenAI的工程师谈过。他们告诉我，现在有一个模型正在设计未来的模型。所以这将发生在所有其他主要模型上。工程师将不再聪明到足以设计下一代模型。」

他继续说：「一旦这件事发生，模型会生成下一个模型，而那个模型将比我们所有人都要指数级地聪明。那就是超级智能。」

要理解这番话的分量，需要了解说话者的位置。孙正义不是一个在媒体上引经据典的技术评论员。SoftBank是OpenAI最大外部股东之一，OpenAI在SoftBank净资产价值中占比超过20%。孙正义不是在解读第三方报道，而是在转述与Sam Altman和OpenAI核心工程师直接对话的内容。

对于孙正义的说法，OpenAI官方给出了一个刻意模糊的回应——不对未发布模型置评，但随即提及：2026年2月，OpenAI已经公开表示，其GPT-5.3-Codex是「第一个在创建自身过程中发挥工具性作用的模型」。

官方的具体描述是：那个Codex团队「使用早期版本调试自己的训练过程、管理自己的部署、以及诊断测试结果和评估」。

这句话值得反复阅读：调试自己的训练、管理自己的部署。这不是程序员让AI帮忙补全代码的那种辅助。这是一个AI系统介入了自己的孵化过程，成为自身生产流程中的一个有效节点。它不只是工具，它是参与者。

然而，孙正义的描述比OpenAI官方声明走得更远——他说的是「设计（designing）」，而官方说的是「工具性作用（instrumental in creating）」。从「工具性参与」到「设计」，如果属实，这个跨越将意味着技术图景的质变。这也是为什么这场对话值得深究，而非仅凭孙正义一人之言就下判断。

二、Anthropic的报告：把加速度量化成可检验的数字

孙正义的言论是第一手但难以独立核实的信息。而Anthropic的RSI报告，则提供了可以被外界检验的数字依据。这份来自Anthropic研究院的文件，结合了内部未公开数据与公开基准测试，其中某些数字比业界此前的估计都要惊人。

工程师代码产出量：8倍

Anthropic工程师平均每季度发布的代码量，是2021-2025年均值的8倍。报告明确指出，这不是因为他们工作时间变长，或者人才结构改变，而是因为AI编程工具的深度介入，让同样的人、同样的时间，能完成过去8倍的工作量。

这个数字有两层含义。第一层是效率：AI显著放大了工程师的个体生产力。第二层更值得关注：当工程师无法在没有AI帮助的情况下维持当前的产出速度，他们与AI工具的关系就不再是「使用工具」，而是「依赖协作者」——这是一种不可逆转的依赖关系，在生产力层面已经形成。

任务时长的加速曲线：每4个月翻倍

Anthropic报告的核心发现之一，是AI能独立可靠完成任务的时长的增速变化：

原先的增速：每7个月翻倍。当前的增速：每4个月翻倍。

具体里程碑：

2024年3月：Claude Opus 3可完成人类需要约4分钟才能完成的软件任务
2025年：Claude Sonnet 3.7达到约1.5小时
2026年：Claude Opus 4.6达到12小时的任务

如果这个曲线维持，「需要技术人员工作几天的任务」今年就可能进入AI能力范围；到2027年，可能是几周的工作量。这个曲线是指数的，不是线性的——每一次「下一个节点」都会超出直觉预期。

基准测试饱和：从低个位数到满分，2年时间

软件工程权威测试SWE-bench给AI一个真实开源代码库和真实Bug报告，要求它写出能通过该项目测试的修复代码。2024年，AI系统在此测试上得分处于低个位数。2026年，SWE-bench「饱和」——AI得分接近测试集上限。2年时间。

研究论文重现测试CORE-Bench（给AI代码和数据，要求重现已发表研究结果）：AI从20%成功率到饱和，用了15个月。

这两个基准饱和的速度，让AI研究者开始担忧一个问题：我们的测试框架能追上AI能力增长的速度吗？当基准饱和，不代表AI能力停止增长，而是代表我们失去了衡量尺度。

Anthropic的「闭环」定义

报告里出现了一个关键词：「Closing the Loop（闭环）」——指AI系统变得足够强大，可以自己构建和训练后继模型的那个时刻。文件说：「届时，未来版本的Claude将可能由Claude自己持续改进。」

然后报告补充了这句让人难以忽视的话：「我们还没到那里，但它可能会比大多数机构准备好的时间更早到来。」

注意这个句子的结构。它不是在说「这还很遥远」，而是在说「准备不足」。这是一个关于治理和制度的警告，不只是技术路线图的描述。

三、孙正义的时间线：一段值得追踪的压缩史

孙正义2026年6月5日的言论，不是他第一次做出关于AI的大胆预测。追溯他近2年的预测历史，能发现一个有趣的压缩模式。

2024年6月，SoftBank股东大会

孙正义在这个罕见的公开亮相中，做出了一个当时被媒体广泛报道的预测。他区分了两个概念：人工通用智能（AGI）——比人类聪明1-10倍——和人工超级智能（ASI）——比人类聪明1万倍。

他的时间线：AGI在3-5年内，ASI在10年内。

这在当时听起来已经足够激进。但他在同一场讲话中留下了一句更值得关注的补充：「SoftBank是为了什么目的而存在？Masa Son是为了什么目的而出生？我认为我生来就是为了实现ASI。我是非常认真的。」

这不是营销话术。孙正义是一个习惯于用使命感框架来解释自己商业决策的人——从1999年投资马云，到2016年软银收购Arm，他的重大赌注背后，总是伴随着这种近乎宗教式的确信感。

私下吐露的「真实时间线」

在2024年下半年的一次采访中，孙正义透露了一个细节：「我说10年是因为想保守一点，怕人们太震惊。我心里其实认为是4年。」

这个「修正」并不是虚荣。它说明孙正义在公开场合有意压低了他真实的预期——这本身就是一个信号：他认为哪怕是他「保守」版本的预测，都已经让公众感到不适。

2026年6月5日，巴黎的再次加速

「现在我说，ASI将在未来2年内到来。」

他还补充了一个具体的判断：「在未来几年，AI将在70-80%的科目上比人类更聪明，而在那些科目里，它可能比普通人聪明10倍。」

从10年到4年到2年，这个压缩，有两种解读：

解读A（技术信号）：孙正义比其他公众人物更早接触到前沿AI系统的真实能力曲线，因此他的预测更接近内部人的判断。压缩的时间线，反映的是技术加速的客观现实，他只是提前把这个现实说了出来。

解读B（利益驱动）：SoftBank的净资产深度绑定OpenAI股权和Arm股票，更激进的ASI叙事能推高AI投资估值，对SoftBank的持仓直接有利。孙正义有经济动机来放大AI预期，就像他当年放大互联网泡沫的预期一样。

这两种解读并不互斥。它们可能同时成立：既有基于内部信息的真实判断，也有利益驱动的叙事放大。正因为如此，我们需要用独立的技术数据——比如Anthropic的量化报告——来交叉验证，而不只是听信一位亿万富翁的预言。

四、OpenAI自己的文件：「早期迹象」的官方确认

在所有信息源中，有一份文件提供了独特的视角——OpenAI在2026年6月提交的联邦AI治理框架白皮书。

这份文件的核心是向美国国会建议建立AI监管框架。但在描述当前技术状态时，它写道：

「当前系统中已经出现了递归自改进的早期迹象（early signs of RSI）。我们预期这将加剧开发者和国家之间的竞争压力，并制造出现有机构无法应对的治理挑战。随着RSI的涌现，社会将需要找到方式来塑造AI开发的轨迹，并确保其服务于人类利益。」

这是OpenAI在正式政策文件中，对RSI出现的官方确认。措辞比孙正义的采访更谨慎（「早期迹象」而非「正在发生」），但方向一致。

更重要的是这段话的后半部分的四个关键短语：「加剧竞争压力」、「现有机构无法应对」、「制造治理挑战」、「需要新的治理方式」。

这不是在庆祝一个技术里程碑。这是OpenAI向立法者发出的一份风险提示：我们描述的这个东西，已经超出了现有治理框架的处理能力。

这与Anthropic RSI报告的立场形成了跨公司的高度一致——两家相互竞争的顶级AI公司，在同一个时间窗口里，都在向公众说同一件事：AI自主改进的迹象，已经是可观察的现实，而不是远期假设；而我们面对它的准备，严重不足。

五、技术边界：AI设计AI≠递归自改进，但方向相同

这是整场讨论里最容易被混淆、也最值得仔细分辨的技术问题。孙正义说「AI正在设计下一代模型」，OpenAI说「Codex在创建自身过程中发挥了工具性作用」。这和Anthropic所定义的「递归自改进」是一回事吗？

答案：目前还不完全是，但已经在同一条路上。

按照Anthropic的严格定义，RSI指的是「一个AI系统能够完全自主地设计和开发自己的后继者」。「完全自主」是关键词——没有人类工程师设定训练目标、决定架构方向、做最终取舍。

目前已知的情况是：OpenAI的Codex参与了调试训练过程、管理部署、诊断测试结果。这是高度有价值的工具性参与——但工程师仍然在决定「什么是好的模型」、「应该往哪个方向优化」、「这个测试是否代表了我们真正想要的能力」。

有一个有用的类比：波音787的飞行管理系统可以自主维持巡航飞行，甚至完成进近——高度自动化。但飞行员仍然决定目的地、处理意外、承担最终责任。「飞机设计飞机」意味着一架AI控制的飞机，自主决定了下一代飞机的气动构型、材料选择和安全标准。当前AI的状态，是在「高阶自动驾驶」阶段——离「完全无人驾驶」还有本质性的跨越。

从「工具性参与」到「自主设计」，所需要的不只是更快的芯片，而是在目标设定能力、价值对齐、自我建模和不确定性处理等维度的根本性进步。Anthropic明确表示：「我们还没到那里（We are not there yet）。」

然而同一份报告也指出：这「可能比大多数机构准备好的时间更早到来」。加速的任务时长曲线（每4个月翻倍）意味着：从「工具性参与」到「自主设计」的距离，正在快速缩短，而不是维持不变。

这就是为什么孙正义和Anthropic谈论的，虽然是不同程度的同一件事，但指向同一个方向。

六、值得质疑的声音：批评者的合理论点

批评孙正义的声音，在技术圈从未缺席。

利益绑定的合理怀疑：SoftBank的财务回报与AI行业景气度深度绑定。OpenAI占其NAV超过20%，Arm是AI芯片设计的核心玩家，占其NAV逾50%。孙正义对AI叙事的热情放大，不可避免地与其投资组合的利益产生交集。更激进的「2年内ASI」叙事，推高AI估值，对SoftBank直接有利。这不代表他在撒谎，但它意味着他有动机来夸大进展，就像他当年高调进入互联网行业时一样。

技术质疑的本质：部分AI安全研究者指出，「基准测试饱和」与「通用智能进展」之间，存在本质性的差距。Claude Opus 4.6能独立完成12小时的软件任务，但这不等于它能理解「什么是好的AI设计」并据此主动提出架构改进方向。软件任务能力的泛化，不等于AI自主设计所需的自我建模能力、元认知能力和开放世界推理能力——后者目前没有可靠的基准可以衡量。

军备竞赛叙事的负面效应：Anthropic在RSI报告里坦承，「AI实验室之间协调放慢RSI开发，将是一件好事」。但这种协调极难实现，原因之一正是充斥市场的「先到先得」竞争叙事——而孙正义的「2年内ASI」声明，恰恰会加剧这种叙事，让任何减速协议都更难推进。Anthropic发出安全警告，却同时是加速开发的参与者，这本身就是AI治理困境的缩影。

然而，批评孙正义的动机，不能取消Anthropic数据的意义。8倍代码产出、每4个月翻倍的任务时长、2年内SWE-bench饱和——这些不是孙正义说的，是Anthropic从自己的工程实践里量化出来的数字，任何人都可以用自己的数据来验证或反驳。质疑孙正义的动机和质疑「这些数据是否真的意味着RSI临近」，是两个独立的问题，需要分开回答。

七、Anthropic的双重角色：推动者与警告者并存

Anthropic在这件事里扮演的角色值得单独分析，因为它极为特殊。

这是一家正在积极推进AI辅助AI开发的公司——8倍代码产出，就是它自己量化出来的数字。同时，它也是目前发出最明确RSI安全警告的公司。Anthropic的研究人员，一边在把AI推向能完成12小时任务的新高，一边在向公众说：这条路走到尽头可能有我们失去控制的风险。

这种双重角色，不是虚伪，是一种被迫的两难。技术路线上的「竞争现实」制约了每一个参与者的选择空间：如果你不推进AI能力，竞争对手会推进然后超越你；如果你推进，你就是在加速你同时警告世界要小心的趋势。

Anthropic的立场是：「协调减速会是一件好事，但在那之前，我们有义务清楚地告诉公众和监管者，这件事正在发生，以及它意味着什么。」报告的最后，他们明确表示对「AI实验室之间协调放慢RSI开发」持开放态度。

这不是最令人放心的答案，但它比「只推进、不谈风险」更接近诚实。一个正在加速某项技术的公司，主动向全球发布关于该技术风险的量化研究报告——这件事本身就是一个难以被轻视的信号：连推动这项技术的人，都在寻求减速出口。这也告诉我们一件重要的事：在这个问题上，没有任何一方可以置身事外，不做判断。每一个使用AI工具的工程师、每一个在公司决策中纳入AI效率因素的管理者、每一个关心科技走向的观察者，都是这个系统的参与者和受影响者。选择不关注，本身也是一种选择。

八、三道门槛：我们现在在哪里

要回答「我们距离AI真正自主设计AI还有多远」，需要区分三个技术门槛，以及我们目前所在的位置：

门槛1：AI辅助AI开发工具链（已发生，并在加速）

AI系统参与调试训练、管理部署、诊断评估——OpenAI的GPT-5.3-Codex已经证明这一点，Anthropic的8倍代码产出量化了规模。这不是未来，这是现在。

门槛2：AI自主决定架构改进方向（模糊边界区，可能正在发生）

这意味着AI不只是执行工程师的指令，而是自主提出并验证「下一代架构应该如何改变」——从「工具」到「代理者」的跨越。孙正义描述的「AI设计AI」，很可能正处于门槛1的高阶形式和门槛2之间的某个位置。这个区域不透明，且OpenAI未公开足够细节供外界判断。

Anthropic的RSI报告提供了一个重要的间接证据：报告描述了AI系统在当前阶段已经能够「运行代码并将数小时的工作委托给其他代理」（agents can now run code themselves and delegate hours of work to other agents）。从「执行代码」到「委托工作给其他代理」，这个能力的演进意味着AI已经开始在有限范围内做出关于「谁应该做什么」的分配决策——这是架构层面决策的初期形态，虽然尚不等于自主设计训练架构，但距离这个方向已经可以看见轮廓。

门槛3：AI完全自主构建后继系统（递归自改进，尚未达到）

AI不需要人类工程师任何干预，自主完成整个新模型的设计、训练、评估和部署。这是Anthropic定义的RSI——他们明确表示「尚未达到」。

让人难以回避的现实是：Anthropic的数据揭示了一个令人不安的趋势——每一个门槛之间的时间距离，正在快速缩短。从门槛1的高阶形式到门槛2，不再是10年，可能是18个月。而孙正义的时间线压缩——10年到4年到2年——恰恰是这个「距离缩短」的主观版本表达。当技术专家说「可能比大多数机构准备好的时间更早」，而投资者说「2年内」，两种视角的交汇，比任何单一声音都更值得我们停下来认真思考。

九、从竞争叙事到真实后果：SoftBank的投资逻辑

孙正义的「AI将在2年内实现ASI」，不只是一句预言，它背后是一套完整的投资逻辑在支撑。

SoftBank在2026年已经构建了一个高度集中的AI生态持仓：Arm Holdings（世界领先的AI芯片架构设计公司，占SoftBank净资产价值的50%以上）、OpenAI（NAV占比超过20%）、Stargate项目（SoftBank与OpenAI合资的美国AI基础设施项目）、法国AI数据中心（750亿欧元，刚刚在巴黎宣布）。

这意味着，孙正义对AI的预测，不只是他对技术走向的个人判断，也是他用真金白银押注的方向。他每一次在公开场合把ASI时间线往前推，都是在为自己的持仓叙事背书。

但这种「利益绑定」也构成了一种特殊的信息价值：当一个在同一件事上押注了数千亿美元的人说「AI将在2年内超过人类」，他的激励结构要求他非常认真地对待这个问题——因为如果他错了，他将失去巨量财富。这不能排除他仍然会在公共场合过度乐观，但至少他不是在随口预测。

孙正义在巴黎的采访里还提到了另一个数字：AI革命比互联网泡沫大50倍。他是少数亲历1990年代互联网泡沫、在泡沫顶峰一天之内损失超过700亿美元纸面财富，却依然坚持AI投资的人之一。他比任何人都清楚，泡沫崩溃会是什么感觉，以及为什么在泡沫崩溃之后，真正的大趋势依然存在。

这一层背景，让他的「50倍」不只是营销词汇，而是一个见过1929年大崩溃、却依然相信汽车工业会繁荣100年的人，在做类比。

十、对普通人意味着什么

孙正义、Sam Altman、Anthropic，他们都在同一个时间窗口里，用各自的方式宣告同一件事：AI的自我改进能力正在加速，其影响已经从工程师的个体生产力延伸到AI系统设计本身。

对大多数人来说，「AI设计AI」听起来很遥远，但它的具体形态其实已经非常日常——

当一个调试自己训练过程的AI变得普遍，这意味着未来的模型优化不再需要数百名工程师手动排查问题。迭代速度会更快，改进周期会更短，而「什么是改进、什么是退步」的判断，将越来越多地发生在人类难以直接观察的层次。这不只是效率提升，这是AI开发过程的「黑箱化」加速——人类在这个过程中的参与，将从「设计者」逐步变为「审批者」，再到「监督者」。关键的技术决策，将越来越多地发生在算法内部，而不是工程师的思考过程中。

这个「黑箱化」的后果，是多层次的。在直接技术层，工程师对模型内部状态的理解将下降——他们知道输入了什么（训练数据、目标函数），知道输出了什么（模型行为），但越来越不了解「为什么这样」。在组织层，AI团队的职能会从「构建」转向「评估和监督」，这对人才结构提出了新要求。在社会层，「谁对AI系统的行为负责」这个问题将变得越来越难回答——当一个AI系统的关键决策是由它的前驱系统做出的，责任链条将无限延伸到我们无法追溯的过去。这不是假设，这是Anthropic报告描述的那条路的终点。它要求我们现在就开始构建新的透明性工具和问责机制，而不是等到黑箱已经关上。

当工程师生产力8倍增长成为行业标准，它从技术层面验证了劳动力市场正在发生的事：同样的输出，所需的人力在系统性减少。这与AI裁员87714人的Challenger报告描述的现实，是同一枚硬币的两面——AI在创造生产力增量的同时，也在重新定价人类劳动的边际贡献。生产力增长和就业压力，正在同步发生，且两者都来自同一个根源：AI能力的快速扩展。

当两家顶级AI公司同时向立法者警告「RSI已有早期迹象，现有机构无法应对」，这意味着监管框架的建立正在与技术发展赛跑。而目前的客观状态，是监管跑在后面：大多数国家的AI治理框架，还在讨论「如何规范ChatGPT的使用」，而行业前沿已经在讨论「AI自主改进后，谁对后果负责」。这个时差，可能比我们意识到的更危险。

孙正义把2年ASI这个数字说出来，也许会像他之前的10年和4年一样继续被修正。重要的不是那个具体的数字，而是这种压缩的方向：一个掌握第一手信息的人，在不断把时间线往前推，而不是往后推。

这件事，值得每一个和AI共存的人认真对待——不是陷入末日叙事，而是想清楚：在这个趋势里，自己想要的位置，和应当扮演的角色。

「当我说它将在10年内到来时，我是在努力保守，因为人们会被吓到，」孙正义告诉CNBC记者，「在我心里，我认为是4年。现在我说，这是2年内的事。」

这番话里，最值得关注的不是那个数字。而是：一个有着第一手信息的人，在不断压缩他的预测，而不是推迟它。当预言者开始报告而非预测，当内部人开始公开确认而不只是暗示——这件事的紧迫性，已经不再只是科幻小说的情节。预言和数据，正在同向叠加。

参考资料

AI is designing OpenAI’s next model in a sign of ‘superintelligence’: SoftBank’s Masayoshi Son — CNBC，2026年6月5日
https://www.cnbc.com/2026/06/05/softbank-masayoshi-son-openai-model-super-intelligence.html
When AI builds itself — Recursive Self-Improvement Report — Anthropic Institute，2026年6月5日
https://www.anthropic.com/institute/recursive-self-improvement
AI revolution is ‘50x bigger’ than the dot-com boom: SoftBank’s Masayoshi Son — CNBC，2026年6月1日
https://www.cnbc.com/2026/06/01/softbank-masayoshi-son-ai-revolution-investment.html
SoftBank CEO says AI that is 10,000 times smarter than humans will come out in 10 years — CNBC，2024年6月21日
https://www.cnbc.com/2024/06/21/softbank-ceo-predicts-ai-that-is-10000-times-smarter-than-humans-.html