当安全叙事成为武器:美国政府关停Fable5的真正逻辑

2026年6月12日下午5点21分,Anthropic收到了一封来自美国政府的指令。

不是一次警告,不是一次问询——而是一道命令:立即停止Fable 5和Mythos 5对所有用户的访问,包括Anthropic自己公司里的外国籍员工。理由是:国家安全。

没有具体的技术细节,没有可供反驳的证据,没有预先通知。只有一个结论和一个期限。

这是Anthropic迄今为止遭受的最直接的一次国家权力介入。而这次事件所揭示的,远比”一个AI模型被关停”要深刻得多。


事件经过:从5点21分开始的72小时

Anthropic在官方声明中披露的时间线几乎是实时的:

6月12日 17:21(东部时间):收到政府指令,内容是依据国家安全权限,发布出口管制令,暂停所有”外国国民”对Fable 5和Mythos 5的访问——无论这些外国国民身处美国境内还是境外,也无论他们是否是Anthropic的正式员工。

政府的理由:据Anthropic称,政府认为已知悉一种”绕过” Fable 5安全护栏的越狱方法,并以此为由援引国家安全授权。

Anthropic的回应:公司声明已审查了政府所提供的技术证据,认为该漏洞仅是一个”narrow, non-universal jailbreak”(狭义、非通用型越狱)——本质上不过是让模型阅读一段代码库并修复其中的软件缺陷。

更关键的是,Anthropic在声明中直接点出:同样的操作,用OpenAI的GPT-5.5可以实现,且这类操作每天都在被安全从业者们用于防御工作。

换言之:如果这一标准适用于Anthropic,那么同样的标准理论上应当适用于所有前沿模型提供商——包括OpenAI。


技术真相:一个并不致命的漏洞

在详述为什么这一事件如此重要之前,有必要先厘清它所基于的技术事实。

Anthropic在Fable 5发布时采用的是纵深防御策略(defense in depth)。其逻辑是:

  1. 要求在Fable 5项目中保留30天客户数据(这本身是一项有代价的商业政策变更),以便快速检测并关闭任何成功的越狱攻击。
  2. 在发布前,联合美国政府、英国AISI、多个第三方组织和内部团队,累计数千小时红队测试
  3. 明确承认”完美的越狱防御目前并不可能”,但将目标定在:让越狱要么极度狭窄(非通用),要么代价极高。

而政府提出的具体漏洞,在Anthropic的评估中属于:

  • 非通用型越狱(无法广泛绕过模型的安全护栏)
  • 能力等同于已有模型(GPT-5.5可以做同样的事情)
  • 无已知有害输出(未发现任何导致实际危害的案例)

从纯技术视角看,这不是一个足以justify关停数亿用户使用模型的理由。

但这件事的核心,从来就不是技术。


权力结构:谁在用安全叙事做什么

要理解这一事件的真正含义,需要退出技术视角,进入政治经济学视角。

第一层:出口管制的泛化

美国对科技出口管制的权限近年来持续扩张。从芯片(NVIDIA H100),到软件(EDA工具),再到现在的AI模型,美国政府管控”敏感技术流向外国国民”的逻辑链条在持续延伸。

Fable 5事件的独特之处在于:它管控的不是硬件,不是代码,而是一个正在运行的服务的访问权限——包括对Anthropic自己雇用的外国籍员工。

这意味着出口管制的概念正在发生根本性变化:从”限制谁能得到这个东西”,演变为”限制谁能使用这个服务”。这一逻辑一旦成立,将对所有提供面向全球用户的AI服务的公司产生深远影响。

第二层:Anthropic的安全叙事反噬了自己

从2023年至今,Anthropic始终将”安全”作为核心差异化叙事。这一叙事在商业上是成功的——帮助Anthropic建立了与政府机构的深度关系,获得了涉及国家安全领域的合同,并为其高估值提供了”更安全”的溢价。

但这套叙事现在面临一个悖论:你越是强调你的模型能力强大到需要特别安全护栏,就越是为政府提供了以”国家安全”为由进行干预的正当性依据。

Anthropic在Fable 5系统卡(System Card)中用了319页来详述模型的能力边界和安全机制,其中包括了关于网络安全风险的大量描述。这份文件本身,可能就是政府用来界定”需要管控”的依据之一。

第三层:先例与后续

Anthropic在声明中明确表示不同意这一决定,并指出:如果这一标准被统一执行,将”essentially halt all new model deployments for all frontier model providers”(基本上阻止所有前沿模型提供商的所有新模型部署)。

这不是一个修辞夸张——这是一个严肃的技术和政策警告。

如果政府可以以”发现了一个非通用越狱”为由,无需经过透明、公正、基于技术事实的程序,就强制关停一个商业模型——那么这个权力将被如何使用?被谁使用?用于什么目的?


商业影响:IPO倒计时里的新变量

这一事件对Anthropic的商业影响不容小觑,尤其在IPO前夕。

短期影响:Fable 5和Mythos 5的暂停意味着Anthropic的付费用户——无论是企业客户还是个人订阅者——在此期间无法访问其最高端的模型。对于依赖Fable 5进行关键任务(如代码生成、研究分析)的企业用户,这是一次服务中断。

中期影响:政府的干预行为向企业客户发出了一个信号:即使一家AI公司与政府关系密切,其核心服务仍然可以在无预警的情况下被暂停。这对于任何依赖Anthropic服务的企业来说,都是一个新的供应链风险因素。

长期影响:这一事件对Anthropic的护城河叙事(”更安全的AI”)构成了复杂的影响。一方面,它证明了政府信任Anthropic遵从指令的能力;另一方面,它也暴露了”安全叙事”可能成为政府干预的切入点。


更深的问题:AI监管的程序正义

Anthropic在声明中提出了一个值得关注的结构性诉求:

“We believe the government should have the ability to block unsafe deployments, as part of a statutory process that is transparent, fair, clear, and grounded in technical facts.”

我们相信政府应有权阻止不安全的部署,但这需要通过一个透明、公正、清晰、基于技术事实的法定程序。

这是Anthropic第一次公开将这一诉求明确表述为政策立场——政府可以管,但需要有程序正义。

这一立场的重要性在于:它既不是对政府权威的全面抗拒,也不是无条件的服从。它在寻求一种新的制度安排。

但在这种制度安排尚未建立的当下,权力的运作将继续依赖非正式的、不透明的机制——而受制约最深的,将是那些选择了”安全”作为核心叙事的公司。


结语:那个无法回避的问题

Anthropic联合创始人、CEO Dario Amodei在此前多次公开讲话中描绘过一个AI发展的可能未来——在那个未来里,AI系统的能力将超过人类,而最重要的问题是:谁在掌控这些系统?

现在,在一个更局部的场景里,这个问题的一个初步答案浮现了:

当政府在一个下午5点21分向你发出指令,而你必须在同一天完成关停——

“谁在掌控”,其实已经有了答案。

只是,那个答案的逻辑和程序,还没有被清晰地写在任何一部法律里。


来源:Anthropic官方声明(anthropic.com/news/fable-mythos-access,2026-06-12);Reuters(2026-06-13);TechCrunch(2026-06-12)