五角大楼开始找Anthropic的替代者:25名士兵的测试,与一场AI供应链重构的开幕
一份内部邮件,让整个军方AI生态开始重新站队
2026年5月21日,Bloomberg的一篇报道揭开了一个被低调运作数周的真相:五角大楼正在主动、系统性地测试Anthropic Claude的替代产品。
这不是因为某次故障,也不是因为合同到期。
这是因为,几个月前,美国国防部内部将Anthropic列为”供应链风险”——然后,他们真的开始采取行动了。
(注:Bloomberg报道基于内部知情人士信源,Anthropic对此拒绝置评(”declined to comment”)。本文基于Bloomberg报道及多方可公开验证的背景信息进行分析。)
从黑名单到主动替换:一条并不漫长的路
要理解这件事的重量,需要先回到这段故事的起点。
2026年4月30日,华尔街日报和Bloomberg同时报道了五角大楼将Anthropic从AI采购优先名单上移除的消息。理由是”供应链风险”——一个在军方采购体系中含义极其敏感的词汇,通常意味着对依赖性过强、可替代性过低、或透明度不足的供应商的战略性担忧。
当时,外界的普遍解读是:这是一次政治表态,或者是谈判筹码,或者仅仅是官僚体系里的一个文件标注。毕竟,Claude在军方内部已经被广泛使用,实际替换的成本很高。
但5月21日的Bloomberg报道告诉我们:不是的。
五角大楼不仅仅是在文件上标注了风险,而是启动了一个由25名重度Claude用户参与的正式对比测试项目。这25人被要求在相同任务场景下使用不同的AI模型,并提交详细的评估报告。与此同时,国防部已经在5月内与多家竞争对手AI公司签署了新的合作协议,开始将这些工具部署到机密网络环境中。过渡计划的时间窗口是:6个月。
这不是调查,这是换人流程。
25个人,为什么重要
军方测试,讲究的是具体数字背后的含义。
“25名重度用户”这个表述,在军事采购语境下不是小数目,而是一次认真的内部效能评估。这些用户不是随机抽取的普通行政人员,而是在日常工作中高频率使用AI工具、对模型能力有深度认知的专业人员——情报分析师、作战规划支援人员、政策文件起草者,或者在演习中大量使用Claude的技术岗位。
他们被要求做的事情,是直接将Claude与竞争对手在同等任务条件下进行比对测试。Bloomberg的报道未披露具体的候选模型,但根据已知的军方AI合作格局(以下为基于公开报道的分析推断),最有可能的候选者包括:
-
OpenAI的GPT系列:OpenAI于2026年5月19日刚刚公开了其与国防部(现更名”战争部”)的合作协议条款(来源:openai.com,可公开访问),主动披露了明确的红线——禁止大规模国内监控、禁止指挥自主武器系统、禁止用于高风险自动化决策。这种透明化策略,恰好是Anthropic被批评为缺乏的东西。
-
Google的Gemini Enterprise版:Google Cloud已获得FedRAMP High认证,其政府云服务是联邦机构承接机密级工作负载的重要基础设施(来源:Google Cloud公开合规文档)。此处提到的CAISI具体参与情况,为基于公开报道的推断,非官方确认。
-
其他通过FedRAMP高级认证的专用政府模型:包括Scale AI提供的模型托管服务,以及多家国防科技承包商(Palantir、Anduril等)集成的专有AI系统。Palantir Maven Smart System的军方部署,来源于2022年以来的多篇公开报道(CSIS, Defense One等),具体当前状态为公开信息的综合分析。
这种”平行测试”的设计,本质上是在为一个关键问题寻找答案:如果今天把Claude从工作流里完全拔掉,会发生什么?替代方案能胜任吗?用户能接受吗?过渡成本可控吗?
测试结果将决定6个月过渡计划的具体执行路径,以及哪些工具将成为Claude的长期替代者。
六个月,是宽限还是窗口
“六个月过渡计划”这个措辞,被Bloomberg的报道以相当中性的方式呈现,但它背后包含的信息量远比字面上要多。
六个月,在军方采购节奏里是极短的时间。通常情况下,一个大型IT系统的替换,从需求分析到最终上线,需要数年时间。但六个月的窗口意味着:这不是一个让供应商”来改正”的缓冲期,而是一个让替代方案站稳脚跟的执行窗口。
换句话说:过渡计划已经在执行,而不是在等待。
五角大楼已经在机密网络上部署了新的AI工具。这一细节尤其关键——机密网络(SIPR、JWICS等)上的部署,需要经过严格的安全认证流程,包括FedRAMP授权、国防部IT系统认证(DIACAP/RMF框架)等,不是短期内能随意调整的。
国防部在5月已经签署了与多家AI公司的新协议,意味着竞争对手已经实质性地进入了之前由Anthropic主导的市场空间。这批新协议的规模和具体内容虽然未被公开,但其在时间上与五角大楼宣布替换测试几乎同步,绝非偶然。
OpenAI的精准操作:在正确的时刻,发出正确的信号
就在Bloomberg报道五角大楼测试替代者的同一时间窗口,另一件值得注意的事情发生了。
2026年5月19日,OpenAI在官网主动公开发布了其与美国国防部(战争部)的合作协议条款:
- 禁止将OpenAI技术用于大规模国内监控
- 禁止用于指挥自主武器系统
- 禁止用于高风险的自动化决策场景(如社会信用系统等)
这份文件的战略价值,不在于它划定的红线,而在于它主动公开这些红线的行为本身。
在Anthropic被五角大楼以”供应链风险”为由边缘化的节点上,OpenAI的这份透明度宣示传递了一个清晰的信号:我们能给你们想要的可预测性和可审计性,同时我们主动告诉你们边界在哪里。
这套叙事,比单纯的技术竞争要高明得多。军方客户不仅需要”更好的模型”,他们更需要”可控的模型”——能够事先知道供应商会做什么、不会做什么,能够对模型的行为进行审计,能够在出现问题时进行问责。
OpenAI选择在这个时间点公开协议条款,是一次教科书级别的B2G(Business to Government)市场定位操作。
这件事为什么比所有人想的都更重要
表面上看,这是一个关于Anthropic失去一个政府大客户的故事。
但实际上,它是一个关于”谁有资格为美国军方提供AI”这个底层权力结构问题正在被重新定义的故事。每一家AI公司、每一家依赖单一AI供应商的大型企业组织,都应该仔细读懂这里面的几层含义。
第一层洞察:合规壁垒将成为军用AI的核心护城河
Anthropic被列为供应链风险,核心问题不在于模型能力——Claude在多数基准测试中仍处于第一梯队,Claude 3.7 Sonnet和Claude Code在编程辅助场景尤其突出——而在于以下几个维度的失分:
供应链透明度:美国国防部对AI供应商的要求,不只是”模型好用”,而是”我们知道这个模型是怎么训练的、数据来源是什么、谁在控制它的更新”。Anthropic在这个维度的透明度,显然未达到军方的期望水准。
基础设施控制权:五角大楼内部流传的一个担忧是,Anthropic目前依赖AWS和Google Cloud作为主要算力供应商,而这两家公司本身也是五角大楼的其他IT系统供应商。AI模型的部署基础设施被第三方控制,增加了不可预期的风险链条。
模型更新的可预测性:军方工作流程对AI输出的一致性和稳定性有极高要求。商业AI公司为了竞争,经常进行”悄悄更新”——同一个模型名称下,3个月前的回答和今天的回答可能截然不同。这种不可预测性,在国防场景中是不可接受的。
这意味着,未来军用AI市场的竞争,将不仅仅在技术维度展开,而且将在合规架构、可审计性、基础设施本地化和模型版本锁定等维度展开。这是一个对专注政府/国防市场的AI公司(如Palantir、Scale AI、各家传统国防承包商的AI子公司)极为有利的信号,对通用型大模型公司则是一个必须正视的新挑战。
第二层洞察:这场测试,是企业AI市场的先行指标
五角大楼是世界上对供应链风险最敏感的组织之一,但它不是唯一一个有这种焦虑的组织。
在2026年,各大金融机构、医疗系统、能源公司和关键基础设施运营商,都在问同一个问题:如果我们深度依赖某一家AI供应商,而这家供应商出现问题——无论是监管打压、商业失败、安全漏洞,还是突然改变服务条款——我们的替换成本是多少?替换能完成吗?
五角大楼用”25名士兵的测试”给出了一个示范性答案:你需要提前测试替代方案,而不是在危机发生后才开始找替代者。这六个月的过渡窗口,是”有计划的战略替换”,而不是”被迫的应急响应”。
每一家CIO,看到这则消息后,都应该问自己:如果我们今天要将核心AI工具从供应商A切换到供应商B,我们有多长时间的缓冲期?我们测试过替代方案吗?
第三层洞察:算力绑定,正在成为AI竞争的新维度
Anthropic的故事还有一个背景,因五角大楼的测试而变得格外复杂。
2026年5月21日,SpaceX的IPO招股书(S-1文件)首次公开披露了一个之前仅从侧面报道过的商业细节:Anthropic与SpaceX签署了每月12.5亿美元(年约150亿美元)的算力访问协议,通过2029年5月,总价值约450亿美元。通过这份合同,Anthropic获得了SpaceX在田纳西州孟菲斯Colossus I和Colossus II数据中心的算力资源——超过300MW,22万+张NVIDIA GPU。
这是Anthropic有史以来规模最大的基础设施投入,也是Claude能力提升最重要的算力保障。
但有意思的是:这笔算力,来自Elon Musk旗下的SpaceX——而Musk正是那个在联邦法院与OpenAI的CEO Sam Altman打了数月官司的人,也是通过xAI与Grok直接与Anthropic的Claude竞争的人。
Anthropic付给竞争对手的老板每年150亿美元买算力,用以支撑自己的业务——而这笔钱会支撑SpaceX的AI基础设施建设,间接帮助xAI/Grok的成长。这个商业逻辑的扭曲程度,在AI产业史上大概前所未有。
而对于五角大楼来说,Anthropic的核心算力依赖于一个与竞争对手资本深度纠缠的基础设施,这本身就是一个新的”供应链风险”维度。
谁在填补这个空缺:替换竞赛的参赛者们
五角大楼启动替换测试,意味着一场竞赛已经悄然开始。各家AI公司都清楚这个市场的价值,也都知道拿下军方合同的象征意义——这不仅仅是一份收入,更是整个政府采购生态的入场券。
OpenAI目前处于最有利的竞争位置。5月19日主动公开的协议条款,等于是用一份政策声明换取了信任背书。更重要的是,OpenAI已经在五角大楼的部分非机密项目中获得了实质性部署许可。过去6个月里,他们一直在悄悄地清理合规障碍,为这一刻做准备。
Google的Gemini具有在政府环境中的实际部署经验优势。Google Cloud在联邦政府IT系统中拥有深厚根基,其FedRAMP High认证的政府云服务是承接机密级AI工作负载的重要通道。CAISI框架下的Gemini集成,已经在多个国防承包商系统中测试过一年以上。
Palantir是这场竞赛里最不被外界关注、但内部优势最明显的玩家。Palantir的Maven Smart System(MSS)自2022年起就在为军方提供AI辅助战场管理功能,它的核心优势不在于模型能力,而在于深度集成——它已经和五角大楼的数据管道、指挥系统融合到了几乎不可分离的程度。在这场竞赛里,Palantir卖的不是”更好的Claude替代品”,而是”你需要的不只是一个模型”。
Anduril则代表了另一条路径:不是用通用大模型替换Claude,而是用专为特定军事任务构建的AI系统取代通用AI助手的位置。这对于高度敏感的作战场景来说,可能比任何通用模型都更合适。
这四家公司,加上Nvidia主导的算力基础设施(Anduril 2026年5月完成50亿美元H轮融资,估值610亿美元,其中硬件算力整合是核心投资逻辑),构成了五角大楼AI替换计划最可能的受益者全景图。
Anthropic的处境:最好的时刻,与最难的时刻
Anthropic目前的处境,是一个颇具戏剧性的对比。
在商业维度,公司正在经历成立以来最好的时刻:Q2预计首次实现运营盈利,营收109亿美元,比Q1的48亿美元翻倍以上;Claude Code在开发者社区爆发式增长;企业订阅用户基数快速扩张;SpaceX的算力协议保障了未来3年的基础设施供给。
而在政策与政府市场维度,它正在经历一次严重的信任危机:美国国防部的”供应链风险”标签,是一个在政府采购生态中会产生连锁反应的信号。一旦联邦政府的一个大机构开始主动替换某家AI供应商,其他联邦机构、州政府机构,以及受到联邦法规约束的金融、医疗等行业的采购主管,都会开始重新审视自己的选择。
这种商业成功与政策失利同步发生的局面,揭示了一个Anthropic可能还在摸索的结构性问题:企业级AI市场的成功路径,与政府级AI市场的成功路径,可能要求截然不同的能力组合。
企业级B2B市场需要:模型性能、开发者生态、价格竞争力、集成便利性。
政府级B2G市场需要:合规框架、FedRAMP认证、政治关系、透明协议、可审计基础设施,以及在时间压力下发布明确政策声明的能力。
Anthropic目前在前者已经跑在第一梯队,在后者则暴露出明显的短板。
历史坐标:这不是第一次,也不会是最后一次
AI行业容易让人产生一种错觉:它的发展速度如此之快,以至于一切都是前所未有的。
但军方技术采购里的供应商更迭,有着漫长的历史先例。IBM在1960-1990年代几乎垄断了联邦政府的计算机采购,然后被一批微机厂商和后来的戴尔、惠普逐渐稀释。微软在1990-2010年代主导了政府桌面系统,然后随着云计算的崛起,被迫接受Google和AWS分走了相当大的市场份额。
每一次大的供应商更迭,背后都有一个共同逻辑:现有供应商获得了太大的市场控制权,政府认为这构成了系统性风险,于是主动引入竞争,强制稀释依赖度。
Anthropic的问题,不只是它做错了什么,而是它在AI领域的增长速度太快,快到在军方内部形成了一个”单一供应商主导”的格局,触发了采购风控机制。
这是一个对所有快速成长的AI公司都适用的警示:在B2G(Business to Government)市场,成长速度本身可能成为风险因素。当你的占有率超过某个临界点,你不再只是一个供应商,而是一个需要被”管理”的战略依赖。
五角大楼测试替代方案,从某种程度上说,是在保护自己不过度依赖任何单一AI公司——包括OpenAI、Google,也包括将来可能崛起的任何竞争者。
写在最后:这不是Anthropic一家的问题
五角大楼的这次测试,表面上是Anthropic的公关危机,本质上是整个AI产业从”野蛮增长”向”规范化采购”转型中的一个关键案例。
军方,是最极端也最具参考价值的企业用户。他们的采购逻辑、他们的风险管理标准、他们对供应链可控性的执着,都会在未来几年的时间里,以某种形式渗透到所有对AI依赖度极高的大型机构中。
25名士兵正在测试替代品。这件事,和你的业务可能没有直接关系。
但每一家依赖AI的公司,都应该问自己同一个问题:我们的供应链多元化计划在哪里?我们的替换方案测试过吗?六个月内能完成切换吗?
在AI成为核心基础设施的时代,这不再是”IT采购部门的小问题”,而是每个组织的战略韧性建设的核心议题之一。
参考资料
-
Bloomberg: “Pentagon Tests Rival AI Models in Race to Replace Anthropic” (2026-05-21) https://www.bloomberg.com/news/articles/2026-05-21/pentagon-tests-rival-ai-models-in-race-to-replace-anthropic
-
OpenAI: “Our Agreement with the Department of War” (2026-05-19) https://openai.com/index/our-agreement-with-the-department-of-war/
-
The Verge: “Anthropic is paying $15 billion a year for access to Elon Musk’s data centers” (2026-05-21) https://www.theverge.com/science/935229/spacex-anthropic-ipo-ai-capacity-deal-colossus
-
Reuters: “Anthropic nears first quarterly profit, agrees to pay SpaceX $1.25 billion monthly” (2026-05-21) https://www.reuters.com/business/anthropic-nears-first-quarterly-profit-agrees-pay-spacex-125-billion-monthly-2026-05-21/
-
Fortune: “SpaceX finally files IPO prospectus” (2026-05-20) https://fortune.com/2026/05/20/spacex-finally-files-ipo-prospectus-reveals-revenue-is-up-but-losses-are-too/