当AI开始设计AI:递归自改进临界点全解析
2026年6月5日,巴黎。
孙正义站在法国总统马克龙身旁,刚刚宣布SoftBank将向法国投入750亿欧元建设AI基础设施。记者追问他对AI发展前景的看法,他给出了一个令在场所有人停顿的答案:
「OpenAI下一代模型,正在由另一个AI模型来设计。」
同一天,数千公里之外,Anthropic的研究团队发布了一份名为《When AI builds itself》的研究报告,描述AI辅助AI开发的当前状态与递归自改进(Recursive Self-Improvement,RSI)的临近轨迹。
这两件事放在同一天发生,绝非策划好的营销动作。它们共同指向了一个让业界持续发烧的问题:AI是否正在接近某个自我进化的临界点?而这个临界点,真的比我们想象的更近吗?
一、孙正义说了什么:第一手信息的分量
孙正义接受CNBC记者采访时,措辞出人意料地直白:
「我和Sam Altman谈过,也和OpenAI的工程师谈过。他们告诉我,现在有一个模型正在设计未来的模型。所以这将发生在所有其他主要模型上。工程师将不再聪明到足以设计下一代模型。」
他继续说:「一旦这件事发生,模型会生成下一个模型,而那个模型将比我们所有人都要指数级地聪明。那就是超级智能。」
要理解这番话的分量,需要了解说话者的位置。孙正义不是一个在媒体上引经据典的技术评论员。SoftBank是OpenAI最大外部股东之一,OpenAI在SoftBank净资产价值中占比超过20%。孙正义不是在解读第三方报道,而是在转述与Sam Altman和OpenAI核心工程师直接对话的内容。
对于孙正义的说法,OpenAI官方给出了一个刻意模糊的回应——不对未发布模型置评,但随即提及:2026年2月,OpenAI已经公开表示,其GPT-5.3-Codex是「第一个在创建自身过程中发挥工具性作用的模型」。
官方的具体描述是:那个Codex团队「使用早期版本调试自己的训练过程、管理自己的部署、以及诊断测试结果和评估」。
这句话值得反复阅读:调试自己的训练、管理自己的部署。这不是程序员让AI帮忙补全代码的那种辅助。这是一个AI系统介入了自己的孵化过程,成为自身生产流程中的一个有效节点。它不只是工具,它是参与者。
然而,孙正义的描述比OpenAI官方声明走得更远——他说的是「设计(designing)」,而官方说的是「工具性作用(instrumental in creating)」。从「工具性参与」到「设计」,如果属实,这个跨越将意味着技术图景的质变。这也是为什么这场对话值得深究,而非仅凭孙正义一人之言就下判断。
二、Anthropic的报告:把加速度量化成可检验的数字
孙正义的言论是第一手但难以独立核实的信息。而Anthropic的RSI报告,则提供了可以被外界检验的数字依据。这份来自Anthropic研究院的文件,结合了内部未公开数据与公开基准测试,其中某些数字比业界此前的估计都要惊人。
工程师代码产出量:8倍
Anthropic工程师平均每季度发布的代码量,是2021-2025年均值的8倍。报告明确指出,这不是因为他们工作时间变长,或者人才结构改变,而是因为AI编程工具的深度介入,让同样的人、同样的时间,能完成过去8倍的工作量。
这个数字有两层含义。第一层是效率:AI显著放大了工程师的个体生产力。第二层更值得关注:当工程师无法在没有AI帮助的情况下维持当前的产出速度,他们与AI工具的关系就不再是「使用工具」,而是「依赖协作者」——这是一种不可逆转的依赖关系,在生产力层面已经形成。
任务时长的加速曲线:每4个月翻倍
Anthropic报告的核心发现之一,是AI能独立可靠完成任务的时长的增速变化:
原先的增速:每7个月翻倍。 当前的增速:每4个月翻倍。
具体里程碑:
- 2024年3月:Claude Opus 3可完成人类需要约4分钟才能完成的软件任务
- 2025年:Claude Sonnet 3.7达到约1.5小时
- 2026年:Claude Opus 4.6达到12小时的任务
如果这个曲线维持,「需要技术人员工作几天的任务」今年就可能进入AI能力范围;到2027年,可能是几周的工作量。这个曲线是指数的,不是线性的——每一次「下一个节点」都会超出直觉预期。
基准测试饱和:从低个位数到满分,2年时间
软件工程权威测试SWE-bench给AI一个真实开源代码库和真实Bug报告,要求它写出能通过该项目测试的修复代码。2024年,AI系统在此测试上得分处于低个位数。2026年,SWE-bench「饱和」——AI得分接近测试集上限。2年时间。
研究论文重现测试CORE-Bench(给AI代码和数据,要求重现已发表研究结果):AI从20%成功率到饱和,用了15个月。
这两个基准饱和的速度,让AI研究者开始担忧一个问题:我们的测试框架能追上AI能力增长的速度吗?当基准饱和,不代表AI能力停止增长,而是代表我们失去了衡量尺度。
Anthropic的「闭环」定义
报告里出现了一个关键词:「Closing the Loop(闭环)」——指AI系统变得足够强大,可以自己构建和训练后继模型的那个时刻。文件说:「届时,未来版本的Claude将可能由Claude自己持续改进。」
然后报告补充了这句让人难以忽视的话:「我们还没到那里,但它可能会比大多数机构准备好的时间更早到来。」
注意这个句子的结构。它不是在说「这还很遥远」,而是在说「准备不足」。这是一个关于治理和制度的警告,不只是技术路线图的描述。
三、孙正义的时间线:一段值得追踪的压缩史
孙正义2026年6月5日的言论,不是他第一次做出关于AI的大胆预测。追溯他近2年的预测历史,能发现一个有趣的压缩模式。
2024年6月,SoftBank股东大会
孙正义在这个罕见的公开亮相中,做出了一个当时被媒体广泛报道的预测。他区分了两个概念:人工通用智能(AGI)——比人类聪明1-10倍——和人工超级智能(ASI)——比人类聪明1万倍。
他的时间线:AGI在3-5年内,ASI在10年内。
这在当时听起来已经足够激进。但他在同一场讲话中留下了一句更值得关注的补充:「SoftBank是为了什么目的而存在?Masa Son是为了什么目的而出生?我认为我生来就是为了实现ASI。我是非常认真的。」
这不是营销话术。孙正义是一个习惯于用使命感框架来解释自己商业决策的人——从1999年投资马云,到2016年软银收购Arm,他的重大赌注背后,总是伴随着这种近乎宗教式的确信感。
私下吐露的「真实时间线」
在2024年下半年的一次采访中,孙正义透露了一个细节:「我说10年是因为想保守一点,怕人们太震惊。我心里其实认为是4年。」
这个「修正」并不是虚荣。它说明孙正义在公开场合有意压低了他真实的预期——这本身就是一个信号:他认为哪怕是他「保守」版本的预测,都已经让公众感到不适。
2026年6月5日,巴黎的再次加速
「现在我说,ASI将在未来2年内到来。」
他还补充了一个具体的判断:「在未来几年,AI将在70-80%的科目上比人类更聪明,而在那些科目里,它可能比普通人聪明10倍。」
从10年到4年到2年,这个压缩,有两种解读:
解读A(技术信号):孙正义比其他公众人物更早接触到前沿AI系统的真实能力曲线,因此他的预测更接近内部人的判断。压缩的时间线,反映的是技术加速的客观现实,他只是提前把这个现实说了出来。
解读B(利益驱动):SoftBank的净资产深度绑定OpenAI股权和Arm股票,更激进的ASI叙事能推高AI投资估值,对SoftBank的持仓直接有利。孙正义有经济动机来放大AI预期,就像他当年放大互联网泡沫的预期一样。
这两种解读并不互斥。它们可能同时成立:既有基于内部信息的真实判断,也有利益驱动的叙事放大。正因为如此,我们需要用独立的技术数据——比如Anthropic的量化报告——来交叉验证,而不只是听信一位亿万富翁的预言。
四、OpenAI自己的文件:「早期迹象」的官方确认
在所有信息源中,有一份文件提供了独特的视角——OpenAI在2026年6月提交的联邦AI治理框架白皮书。
这份文件的核心是向美国国会建议建立AI监管框架。但在描述当前技术状态时,它写道:
「当前系统中已经出现了递归自改进的早期迹象(early signs of RSI)。我们预期这将加剧开发者和国家之间的竞争压力,并制造出现有机构无法应对的治理挑战。随着RSI的涌现,社会将需要找到方式来塑造AI开发的轨迹,并确保其服务于人类利益。」
这是OpenAI在正式政策文件中,对RSI出现的官方确认。措辞比孙正义的采访更谨慎(「早期迹象」而非「正在发生」),但方向一致。
更重要的是这段话的后半部分的四个关键短语:「加剧竞争压力」、「现有机构无法应对」、「制造治理挑战」、「需要新的治理方式」。
这不是在庆祝一个技术里程碑。这是OpenAI向立法者发出的一份风险提示:我们描述的这个东西,已经超出了现有治理框架的处理能力。
这与Anthropic RSI报告的立场形成了跨公司的高度一致——两家相互竞争的顶级AI公司,在同一个时间窗口里,都在向公众说同一件事:AI自主改进的迹象,已经是可观察的现实,而不是远期假设;而我们面对它的准备,严重不足。
五、技术边界:AI设计AI≠递归自改进,但方向相同
这是整场讨论里最容易被混淆、也最值得仔细分辨的技术问题。孙正义说「AI正在设计下一代模型」,OpenAI说「Codex在创建自身过程中发挥了工具性作用」。这和Anthropic所定义的「递归自改进」是一回事吗?
答案:目前还不完全是,但已经在同一条路上。
按照Anthropic的严格定义,RSI指的是「一个AI系统能够完全自主地设计和开发自己的后继者」。「完全自主」是关键词——没有人类工程师设定训练目标、决定架构方向、做最终取舍。
目前已知的情况是:OpenAI的Codex参与了调试训练过程、管理部署、诊断测试结果。这是高度有价值的工具性参与——但工程师仍然在决定「什么是好的模型」、「应该往哪个方向优化」、「这个测试是否代表了我们真正想要的能力」。
有一个有用的类比:波音787的飞行管理系统可以自主维持巡航飞行,甚至完成进近——高度自动化。但飞行员仍然决定目的地、处理意外、承担最终责任。「飞机设计飞机」意味着一架AI控制的飞机,自主决定了下一代飞机的气动构型、材料选择和安全标准。当前AI的状态,是在「高阶自动驾驶」阶段——离「完全无人驾驶」还有本质性的跨越。
从「工具性参与」到「自主设计」,所需要的不只是更快的芯片,而是在目标设定能力、价值对齐、自我建模和不确定性处理等维度的根本性进步。Anthropic明确表示:「我们还没到那里(We are not there yet)。」
然而同一份报告也指出:这「可能比大多数机构准备好的时间更早到来」。加速的任务时长曲线(每4个月翻倍)意味着:从「工具性参与」到「自主设计」的距离,正在快速缩短,而不是维持不变。
这就是为什么孙正义和Anthropic谈论的,虽然是不同程度的同一件事,但指向同一个方向。
六、值得质疑的声音:批评者的合理论点
批评孙正义的声音,在技术圈从未缺席。
利益绑定的合理怀疑:SoftBank的财务回报与AI行业景气度深度绑定。OpenAI占其NAV超过20%,Arm是AI芯片设计的核心玩家,占其NAV逾50%。孙正义对AI叙事的热情放大,不可避免地与其投资组合的利益产生交集。更激进的「2年内ASI」叙事,推高AI估值,对SoftBank直接有利。这不代表他在撒谎,但它意味着他有动机来夸大进展,就像他当年高调进入互联网行业时一样。
技术质疑的本质:部分AI安全研究者指出,「基准测试饱和」与「通用智能进展」之间,存在本质性的差距。Claude Opus 4.6能独立完成12小时的软件任务,但这不等于它能理解「什么是好的AI设计」并据此主动提出架构改进方向。软件任务能力的泛化,不等于AI自主设计所需的自我建模能力、元认知能力和开放世界推理能力——后者目前没有可靠的基准可以衡量。
军备竞赛叙事的负面效应:Anthropic在RSI报告里坦承,「AI实验室之间协调放慢RSI开发,将是一件好事」。但这种协调极难实现,原因之一正是充斥市场的「先到先得」竞争叙事——而孙正义的「2年内ASI」声明,恰恰会加剧这种叙事,让任何减速协议都更难推进。Anthropic发出安全警告,却同时是加速开发的参与者,这本身就是AI治理困境的缩影。
然而,批评孙正义的动机,不能取消Anthropic数据的意义。8倍代码产出、每4个月翻倍的任务时长、2年内SWE-bench饱和——这些不是孙正义说的,是Anthropic从自己的工程实践里量化出来的数字,任何人都可以用自己的数据来验证或反驳。质疑孙正义的动机和质疑「这些数据是否真的意味着RSI临近」,是两个独立的问题,需要分开回答。
七、Anthropic的双重角色:推动者与警告者并存
Anthropic在这件事里扮演的角色值得单独分析,因为它极为特殊。
这是一家正在积极推进AI辅助AI开发的公司——8倍代码产出,就是它自己量化出来的数字。同时,它也是目前发出最明确RSI安全警告的公司。Anthropic的研究人员,一边在把AI推向能完成12小时任务的新高,一边在向公众说:这条路走到尽头可能有我们失去控制的风险。
这种双重角色,不是虚伪,是一种被迫的两难。技术路线上的「竞争现实」制约了每一个参与者的选择空间:如果你不推进AI能力,竞争对手会推进然后超越你;如果你推进,你就是在加速你同时警告世界要小心的趋势。
Anthropic的立场是:「协调减速会是一件好事,但在那之前,我们有义务清楚地告诉公众和监管者,这件事正在发生,以及它意味着什么。」报告的最后,他们明确表示对「AI实验室之间协调放慢RSI开发」持开放态度。
这不是最令人放心的答案,但它比「只推进、不谈风险」更接近诚实。一个正在加速某项技术的公司,主动向全球发布关于该技术风险的量化研究报告——这件事本身就是一个难以被轻视的信号:连推动这项技术的人,都在寻求减速出口。这也告诉我们一件重要的事:在这个问题上,没有任何一方可以置身事外,不做判断。每一个使用AI工具的工程师、每一个在公司决策中纳入AI效率因素的管理者、每一个关心科技走向的观察者,都是这个系统的参与者和受影响者。选择不关注,本身也是一种选择。
八、三道门槛:我们现在在哪里
要回答「我们距离AI真正自主设计AI还有多远」,需要区分三个技术门槛,以及我们目前所在的位置:
门槛1:AI辅助AI开发工具链(已发生,并在加速)
AI系统参与调试训练、管理部署、诊断评估——OpenAI的GPT-5.3-Codex已经证明这一点,Anthropic的8倍代码产出量化了规模。这不是未来,这是现在。
门槛2:AI自主决定架构改进方向(模糊边界区,可能正在发生)
这意味着AI不只是执行工程师的指令,而是自主提出并验证「下一代架构应该如何改变」——从「工具」到「代理者」的跨越。孙正义描述的「AI设计AI」,很可能正处于门槛1的高阶形式和门槛2之间的某个位置。这个区域不透明,且OpenAI未公开足够细节供外界判断。
Anthropic的RSI报告提供了一个重要的间接证据:报告描述了AI系统在当前阶段已经能够「运行代码并将数小时的工作委托给其他代理」(agents can now run code themselves and delegate hours of work to other agents)。从「执行代码」到「委托工作给其他代理」,这个能力的演进意味着AI已经开始在有限范围内做出关于「谁应该做什么」的分配决策——这是架构层面决策的初期形态,虽然尚不等于自主设计训练架构,但距离这个方向已经可以看见轮廓。
门槛3:AI完全自主构建后继系统(递归自改进,尚未达到)
AI不需要人类工程师任何干预,自主完成整个新模型的设计、训练、评估和部署。这是Anthropic定义的RSI——他们明确表示「尚未达到」。
让人难以回避的现实是:Anthropic的数据揭示了一个令人不安的趋势——每一个门槛之间的时间距离,正在快速缩短。从门槛1的高阶形式到门槛2,不再是10年,可能是18个月。而孙正义的时间线压缩——10年到4年到2年——恰恰是这个「距离缩短」的主观版本表达。当技术专家说「可能比大多数机构准备好的时间更早」,而投资者说「2年内」,两种视角的交汇,比任何单一声音都更值得我们停下来认真思考。
九、从竞争叙事到真实后果:SoftBank的投资逻辑
孙正义的「AI将在2年内实现ASI」,不只是一句预言,它背后是一套完整的投资逻辑在支撑。
SoftBank在2026年已经构建了一个高度集中的AI生态持仓:Arm Holdings(世界领先的AI芯片架构设计公司,占SoftBank净资产价值的50%以上)、OpenAI(NAV占比超过20%)、Stargate项目(SoftBank与OpenAI合资的美国AI基础设施项目)、法国AI数据中心(750亿欧元,刚刚在巴黎宣布)。
这意味着,孙正义对AI的预测,不只是他对技术走向的个人判断,也是他用真金白银押注的方向。他每一次在公开场合把ASI时间线往前推,都是在为自己的持仓叙事背书。
但这种「利益绑定」也构成了一种特殊的信息价值:当一个在同一件事上押注了数千亿美元的人说「AI将在2年内超过人类」,他的激励结构要求他非常认真地对待这个问题——因为如果他错了,他将失去巨量财富。这不能排除他仍然会在公共场合过度乐观,但至少他不是在随口预测。
孙正义在巴黎的采访里还提到了另一个数字:AI革命比互联网泡沫大50倍。他是少数亲历1990年代互联网泡沫、在泡沫顶峰一天之内损失超过700亿美元纸面财富,却依然坚持AI投资的人之一。他比任何人都清楚,泡沫崩溃会是什么感觉,以及为什么在泡沫崩溃之后,真正的大趋势依然存在。
这一层背景,让他的「50倍」不只是营销词汇,而是一个见过1929年大崩溃、却依然相信汽车工业会繁荣100年的人,在做类比。
十、对普通人意味着什么
孙正义、Sam Altman、Anthropic,他们都在同一个时间窗口里,用各自的方式宣告同一件事:AI的自我改进能力正在加速,其影响已经从工程师的个体生产力延伸到AI系统设计本身。
对大多数人来说,「AI设计AI」听起来很遥远,但它的具体形态其实已经非常日常——
当一个调试自己训练过程的AI变得普遍,这意味着未来的模型优化不再需要数百名工程师手动排查问题。迭代速度会更快,改进周期会更短,而「什么是改进、什么是退步」的判断,将越来越多地发生在人类难以直接观察的层次。这不只是效率提升,这是AI开发过程的「黑箱化」加速——人类在这个过程中的参与,将从「设计者」逐步变为「审批者」,再到「监督者」。关键的技术决策,将越来越多地发生在算法内部,而不是工程师的思考过程中。
这个「黑箱化」的后果,是多层次的。在直接技术层,工程师对模型内部状态的理解将下降——他们知道输入了什么(训练数据、目标函数),知道输出了什么(模型行为),但越来越不了解「为什么这样」。在组织层,AI团队的职能会从「构建」转向「评估和监督」,这对人才结构提出了新要求。在社会层,「谁对AI系统的行为负责」这个问题将变得越来越难回答——当一个AI系统的关键决策是由它的前驱系统做出的,责任链条将无限延伸到我们无法追溯的过去。这不是假设,这是Anthropic报告描述的那条路的终点。它要求我们现在就开始构建新的透明性工具和问责机制,而不是等到黑箱已经关上。
当工程师生产力8倍增长成为行业标准,它从技术层面验证了劳动力市场正在发生的事:同样的输出,所需的人力在系统性减少。这与AI裁员87714人的Challenger报告描述的现实,是同一枚硬币的两面——AI在创造生产力增量的同时,也在重新定价人类劳动的边际贡献。生产力增长和就业压力,正在同步发生,且两者都来自同一个根源:AI能力的快速扩展。
当两家顶级AI公司同时向立法者警告「RSI已有早期迹象,现有机构无法应对」,这意味着监管框架的建立正在与技术发展赛跑。而目前的客观状态,是监管跑在后面:大多数国家的AI治理框架,还在讨论「如何规范ChatGPT的使用」,而行业前沿已经在讨论「AI自主改进后,谁对后果负责」。这个时差,可能比我们意识到的更危险。
孙正义把2年ASI这个数字说出来,也许会像他之前的10年和4年一样继续被修正。重要的不是那个具体的数字,而是这种压缩的方向:一个掌握第一手信息的人,在不断把时间线往前推,而不是往后推。
这件事,值得每一个和AI共存的人认真对待——不是陷入末日叙事,而是想清楚:在这个趋势里,自己想要的位置,和应当扮演的角色。
「当我说它将在10年内到来时,我是在努力保守,因为人们会被吓到,」孙正义告诉CNBC记者,「在我心里,我认为是4年。现在我说,这是2年内的事。」
这番话里,最值得关注的不是那个数字。而是:一个有着第一手信息的人,在不断压缩他的预测,而不是推迟它。当预言者开始报告而非预测,当内部人开始公开确认而不只是暗示——这件事的紧迫性,已经不再只是科幻小说的情节。预言和数据,正在同向叠加。
参考资料
-
AI is designing OpenAI’s next model in a sign of ‘superintelligence’: SoftBank’s Masayoshi Son — CNBC,2026年6月5日
https://www.cnbc.com/2026/06/05/softbank-masayoshi-son-openai-model-super-intelligence.html -
When AI builds itself — Recursive Self-Improvement Report — Anthropic Institute,2026年6月5日
https://www.anthropic.com/institute/recursive-self-improvement -
AI revolution is ‘50x bigger’ than the dot-com boom: SoftBank’s Masayoshi Son — CNBC,2026年6月1日
https://www.cnbc.com/2026/06/01/softbank-masayoshi-son-ai-revolution-investment.html -
SoftBank CEO says AI that is 10,000 times smarter than humans will come out in 10 years — CNBC,2024年6月21日
https://www.cnbc.com/2024/06/21/softbank-ceo-predicts-ai-that-is-10000-times-smarter-than-humans-.html