联合国说AI已经失控了:当全球最大多边机构发出警告,谁来接这个球?

2026年7月1日,路透社独家报道了联合国AI国际科学面板(International Scientific Panel on AI,简称ISPA)的最新年度评估报告。ISPA是联合国于2024年设立的多国科学顾问机构,由来自39个成员国的科学家和政策专家共同组成。这份报告的核心判断,被路透社直接引用:AI的发展速度已经超过了人类的科学理解能力,也超过了各国政策制定的能力。报告进一步警告,若国际社会不能在近期建立协调机制,可能面临灾难性风险。

这不是一个具体的技术问题,而是一个系统性的文明风险警告,来自全球最具合法性的多边科学机构之一。

当”AI跑太快”成为联合国级别的判断

回顾过去三年,”AI发展速度超出人类理解”这个判断其实并不罕见。Geoffrey Hinton在2023年离开Google时说过类似的话。Stuart Russell在剑桥大学的演讲里反复强调过这一点。甚至OpenAI的CEO Sam Altman也在参议院听证会上承认,他”有时晚上会被AI的发展速度吓醒”。

但所有这些声音,最终都被AI产业的加速势头淹没了。这一次有什么不同?

区别在于说话的机构。联合国不是一家AI公司,不是一个倡导团体,也不是某国的监管机构。它代表的是193个成员国就某件事达成的某种共识。当联合国的科学面板说”AI的发展已经超越了我们的理解能力”,背后的含义是:这个判断已经超出了单个国家或机构能够单独应对的范畴

具体而言,ISPA的报告列举了三个相互交织的失控维度:

第一,科学理解层面的失控。 我们部署的AI系统,在某些关键领域,已经没有人能完整解释它的决策逻辑。可解释性问题在过去十年被反复讨论,但模型规模每年翻倍增长的速度,远超过可解释性研究的进展。2026年运行的大型语言模型,其参数量已达到数千亿到数万亿级别,激活机制的复杂程度远超人类可直觉理解的范围。

更令人不安的是”涌现”现象——即随着模型规模扩大,突然涌现出的未被预期的能力。在GPT-3到GPT-4的跨越中,AI突然展现出了基础的逻辑推理能力,这让研究者们感到惊讶。在随后的版本中,出现了更多研究者事先没有设计但模型自发展现的能力。我们甚至无法可靠地预测,当一个大型语言模型的规模从1000亿参数扩展到10000亿参数时,会涌现出哪些新能力。当一个我们无法完全理解的系统突然展示出我们未曾预期的能力时,我们甚至无法判断这种能力的边界在哪里,以及它在什么场景下会以我们不希望的方式运作。

第二,政策制定层面的失控。 法律和法规的制定周期,通常以年计算。一项AI监管法规从立项到生效,往往需要2至5年时间。但在同样的时间窗口内,AI能力会经历数轮代际跨越。欧盟的《AI法案》从2021年开始起草,到2026年全面实施,整整花了5年——而在这5年里,OpenAI已经从GPT-3走到了GPT-5.6,能力发生了质的飞跃。政策追不上技术,这不是新现象,但AI的加速度使这个差距变成了一道无法弥合的鸿沟。

更深层的问题是,现有的法律框架是为一个人类是主要行为者的世界设计的。当AI系统开始自主决策——在金融市场操作、在医疗诊断中给出建议、在内容推荐算法中形塑公众认知——我们沿用了几百年的因果归责体系就开始出现裂缝。”谁对这个AI系统的行为负责?”这个问题,在现有法律框架下,往往没有清晰的答案。产品责任法要求找到制造者,但当AI系统在部署之后通过用户交互持续学习和改变行为时,”制造行为”与”运营行为”的边界就开始模糊。侵权法要求证明因果关系,但当一个算法推荐系统对数十亿人的信息接触产生持续影响时,证明特定算法决策与特定社会后果之间的直接因果关系,在法律和技术层面都极为困难。

第三,国际协调层面的失控。 AI不尊重国界。一个在美国训练的模型可以在欧洲被滥用;一个在中国研发的算法可以影响印度的选举。但现有的国际协调机制——无论是G7、G20还是联合国的各种框架——都依赖主权国家的自愿合作。当国家利益与全球AI治理需要之间产生冲突时,自愿合作的机制就会失效。

2026年,美国政府对Anthropic和OpenAI最先进AI模型实施访问限制,要求它们只向经政府审批的”可信合作伙伴”开放——这是国家安全考量压倒开放精神的具体体现。在这种背景下,”让各国共同监督AI发展”这个理想与”各国把AI当战略武器”的现实之间,存在着难以逾越的张力。

三重悖论:越警告越发展

理解这份报告为何令人不安,需要引入一个反直觉的观察:对AI风险的警告,有时候反而加速了AI的发展

这听起来很荒谬,但逻辑其实很清晰。

当权威机构警告AI存在风险,各国政府的第一反应不是”我们应该减慢速度”,而是”我们不能让其他国家抢先掌控这个风险”。这就是所谓的”安全困境”在AI领域的变体——每一个担忧AI安全的国家,都会加速开发本国的AI能力,以确保在即将到来的AI时代不落后于竞争对手。

2026年的地缘政治现实把这个悖论推到了极端。美国和中国在AI领域的竞争,已经不仅仅是经济层面的比拼,更是国家安全层面的对抗。美国通过出口管制限制Anthropic和OpenAI最先进模型的流通,本质上是把AI能力当成了战略资产。中国加速推进国产AI芯片研发,本质上也是在防范被”卡脖子”的战略风险。在这种背景下,联合国说”请大家慢下来”,其实是在要求各国在竞争中单方面降速——这在现实政治中几乎不可能发生。

悖论一:安全担忧 → 竞争加速。 联合国的警告越真实,各国为了不在AI时代落后而加速开发的动力就越强。这是一个经典的集体行动困境:对每个单独的国家而言,跟上AI发展的步伐是理性选择;但所有国家同时做出这个理性选择,导致的集体结果是全球AI竞赛的持续加速——而这正是联合国报告所担心的状态。没有任何一个国家会在其他国家继续开发的情况下,主动宣布”我们要暂停AI研发”。

悖论二:监管细化 → 合规成本差异化 → 监管套利。 当欧盟制定严格的AI监管法规,被监管的企业可以选择将高风险业务迁移到监管宽松的地区。这不是假设,2026年已经有多家AI公司把部分研发工作迁移到监管框架尚不完善的新兴市场。结果是:监管越严的地方,AI发展越慢;监管越宽松的地方,AI跑得越快;而风险则在全球范围内自由流动,不受任何单一监管体系的管辖。严格监管国家的居民反而可能需要承担来自宽松监管地区的AI风险,同时还失去了本国AI产业的竞争优势。

悖论三:多边对话 → 信息共享 → 能力扩散。 国际AI治理需要各国分享AI安全研究的结果,以便形成共同的风险认知和应对策略。但分享AI安全漏洞和技术细节,同时也意味着为潜在的恶意行为者提供了攻击手册。如何在”开放共享以形成全球风险认知”和”保密以防止技术滥用”之间找到平衡,是国际AI治理面临的一个没有完美解的根本性困境。这就像是你必须告诉全世界”这栋楼有个后门”才能让人帮你把后门堵上,但告诉全世界之后,坏人也知道了这个后门在哪里。

联合国能做什么?执行困境的三个层次

ISPA的报告提出了几项具体建议——部分基于报告公开摘要,部分参考类似国际AI治理框架的标准讨论议题——但仔细审视之下,每一项都面临巨大的执行障碍。

建议一:建立全球AI事故报告系统。 要求各国强制上报重大AI安全事故,类似于航空安全领域的强制报告机制。这在概念上合理,但问题在于:谁来定义”重大事故”?谁来强制执行上报要求?谁来处理涉及国家安全的事故信息?航空安全能够建立有效的国际报告机制,部分原因是飞机失事造成的损失是可见的、即时的、难以隐瞒的。AI系统的失控往往不是这样——它可能是缓慢的、弥散的、难以归因的,各国政府有充分的动机低调处理而不是主动上报。更何况,在美中AI竞争的背景下,向国际机构上报”我们的AI系统出现了问题”,等同于向竞争对手承认自己的弱点。

建议二:设立独立的全球AI研究基金。 由各国政府共同出资,资助独立的AI能力评估和安全研究。这一建议面临的核心挑战是资金来源:谁来出钱?出多少?基金的治理结构如何确保独立性而不被大国操控?参照类似机构的历史,出资最多的国家往往也拥有最大的话语权,这使所谓的”独立性”从一开始就充满疑问。政府控制的研究基金,在国家利益面前,往往会优先服从政治而不是科学。

建议三:制定AI能力分级标准。 对AI系统的潜在危险等级进行分级,对高危等级的AI开发实施更严格的国际监督。问题在于:能力分级需要访问模型的核心参数,而任何商业AI公司都不会接受对竞争对手开放核心技术参数的要求,任何主权国家也不会接受外部机构检查本国AI系统的要求。《核不扩散条约》能够建立核查机制,是因为核武器的物理存在相对容易检测——你需要特定的设施、特定的材料、特定的设备。AI模型存在于计算机集群上,可以在几分钟内复制,可以轻易分散在全球各地的服务器上运行。建立有效的国际AI能力核查机制,面临的技术挑战比核武器核查要困难几个数量级。

这些建议在纸面上都很合理,但它们都依赖一个前提:参与各方愿意主动限制自己的权力和竞争优势。而这个前提,恰恰是当今世界中最稀缺的东西。

谁在接这个球?利益结构分析

真正的问题不是联合国的报告说了什么,而是谁有意愿、有能力、有合法性去推动报告中的建议变成现实。让我们审视当前的利益结构。

大型AI公司。 表面上,OpenAI、Anthropic、Google DeepMind都明确支持AI安全研究,都在公开场合呼吁建立合理的监管框架。但这种支持是有边界的:他们欢迎的是”以自己的产品为中心的监管”,而不是真正可能限制自己商业竞争力的国际监督机制。当Anthropic的CEO Dario Amodei在参议院听证会上支持AI监管时,他同时也在为Anthropic争取更大的话语权来定义监管的内容和边界。AI公司有动机参与对话,但没有动机让这场对话形成真正限制自己的约束。

民族国家政府。 各国政府对AI治理的态度,高度依赖于本国在AI竞争中所处的位置。技术领先国(美国、中国)倾向于设计有利于自己的规则——就像当年核大国在《核不扩散条约》中建立的不对称体系一样。技术落后国倾向于争取更公平的技术获取权,而不是建立限制AI发展的国际框架。这两种需求很难在同一个国际机制下得到满足。全球南方国家的核心诉求是:不要让AI的利益只留在少数技术领先国,AI治理框架不应该成为维护技术霸权的工具。

公民社会和公众舆论。 历史上,公众的觉醒有时能够推动国际规则的形成。气候变化协议、禁止地雷条约、国际刑事法院的建立,都部分得益于全球公民社会的压力。AI治理是否能走同样的路径?问题在于,AI的影响是弥散的、逐渐累积的,它没有核爆炸那样震撼人心的视觉冲击,没有气候变化那样直接可感的物理后果。在一个注意力已经极度分散的信息环境里,推动公众对AI治理产生持续关注,是一个比想象中更难的挑战。

学术界和独立研究机构。 这是最可能真正推动国际AI安全标准的力量,但也是影响力最有限的力量。ISPA本身就代表着这种力量——由科学家和政策专家组成,没有执法权力、没有商业利益牵绊。他们能做的,是持续生产可信的AI风险评估,并试图让这些研究影响政策议程。但这中间有一道从”被引用”到”被执行”的巨大鸿沟。当AI公司赞助AI安全研究时,研究结论不可避免地会被筛选性引用;当”有效加速主义”(e/acc)成为硅谷的一种思潮时,来自学术界的”减速”呼声很容易被标签为保守主义。ISPA发布这份报告,本质上是在宣告:独立科学共识已经积累到了足以影响多边外交议程的临界能量。接下来的问题,是谁有意愿把这种能量转化为行动。

第三层洞察:这是最后的时间窗口

有一个更深层的问题值得探讨:为什么联合国选择在2026年7月发出这份警告?

2026年的AI产业格局与2024年相比已经发生了根本性的变化。GPT-5.6、Claude Fable 5/Mythos 5、最新一代的Gemini……这些系统的能力已经开始触及一些此前被认为是人类专属领域的任务边界。同时,AI在国家安全领域的应用——从网络攻防到军事决策辅助——正在以前所未有的速度扩散。

更关键的是,2026年是AI从”实验室好奇心”到”基础设施骨干”的临界年份。全球各大银行的风控系统里有AI;医疗诊断流程里有AI;法律文书的起草和审查里有AI;发电站的运行调度里有AI。当AI从边缘走向核心,风险的性质也在改变——从”这个AI产品可能有偏见”变成了”如果这套AI基础设施崩溃,整个城市的某些关键功能可能停止运转”。

这是ISPA的科学家们真正担心的事情:我们正在把一套我们尚未完全理解的系统,织入文明运转的底层结构。一旦这个过程完成,想要”后退一步、重新评估”的成本将变得无法承受——就像你无法在不让整个城市断网断电的情况下,把互联网的底层协议换一遍。

这不是末日预言,而是一个关于时间窗口的判断:如果国际AI治理框架不能在未来3至5年内形成,等到AI真正深度嵌入全球基础设施之后,建立有效治理的难度会呈指数级上升。就像气候问题,最好的干预时机永远是现在,而不是等到后果不可逆之后。

真正值得关注的,不是联合国说了什么,而是在未来6到12个月里,哪些具体的政策行动会把这份报告的建议转化为有约束力的国际机制。 如果什么都没有发生,这份报告将成为AI治理史上又一个”早有预警,却未阻止”的案例文本。

如果某些东西真的发生了——比如G20峰会达成AI治理框架协议,或者美中两国就AI安全问题展开双边谈判,或者多个国家协调推动类似《核不扩散条约》的AI国际协议——那才是这份报告真正产生影响的时刻。

历史将会记录我们是否在那个时刻来临之前,做好了准备。

值得一提的是,这份报告发布的同一周,美国政府刚刚解除了对Anthropic Claude系列模型的访问限制——那场持续数周的禁令,正是因为网络安全研究发现模型存在可被武器化的漏洞而引发的。这个巧合本身就是一个隐喻:即使是最成熟的AI治理机制,也只能做出事后响应,而无法预防风险的发生。当安全响应的速度永远慢于技术发展的速度,我们就已经默默接受了”以风险换进步”的交换。这个交换是否合理,是否值得,是这份联合国报告真正想让全人类认真思考的问题。

如果你觉得这个问题离日常生活太远,不妨换一个更具体的思考框架:当你的孩子在使用AI辅助学习工具时,当你的医生在用AI辅助诊断你的病情时,当你所在城市的交通系统由AI调度优化时——你是否愿意接受这样一个前提:这些系统的运作逻辑,连设计它们的人都无法完整解释?如果你觉得不安,那这份联合国报告就是在试图代表你发出那种不安。


参考资料

  • Reuters, “UN panel of AI experts warns of catastrophic risks, AI development outpacing science and policy,” July 1, 2026
  • AP News, “Trump administration lifts restrictions on Anthropic’s Claude models after cybersecurity alarm,” July 1, 2026
  • MSN, “AI regulation is a mess, and Anthropic is caught in the crosshairs,” June 21, 2026
  • Forbes, “How Anthropic, OpenAI, The Vatican and Congress Want to Govern AI,” July 1, 2026
  • CNBC, “Anthropic asked for regulation. Washington went much further,” June 17, 2026
  • TechTimes, “AI Safety Researchers Who Quit OpenAI and Anthropic Are Being Proven Right,” June 22, 2026