五角大楼开始找Anthropic的替代者：25名士兵的测试，与一场AI供应链重构的开幕

一份内部邮件，让整个军方AI生态开始重新站队

2026年5月21日，Bloomberg的一篇报道揭开了一个被低调运作数周的真相：五角大楼正在主动、系统性地测试Anthropic Claude的替代产品。

这不是因为某次故障，也不是因为合同到期。

这是因为，几个月前，美国国防部内部将Anthropic列为”供应链风险”——然后，他们真的开始采取行动了。

（注：Bloomberg报道基于内部知情人士信源，Anthropic对此拒绝置评（”declined to comment”）。本文基于Bloomberg报道及多方可公开验证的背景信息进行分析。）

从黑名单到主动替换：一条并不漫长的路

要理解这件事的重量，需要先回到这段故事的起点。

2026年4月30日，华尔街日报和Bloomberg同时报道了五角大楼将Anthropic从AI采购优先名单上移除的消息。理由是”供应链风险”——一个在军方采购体系中含义极其敏感的词汇，通常意味着对依赖性过强、可替代性过低、或透明度不足的供应商的战略性担忧。

当时，外界的普遍解读是：这是一次政治表态，或者是谈判筹码，或者仅仅是官僚体系里的一个文件标注。毕竟，Claude在军方内部已经被广泛使用，实际替换的成本很高。

但5月21日的Bloomberg报道告诉我们：不是的。

五角大楼不仅仅是在文件上标注了风险，而是启动了一个由25名重度Claude用户参与的正式对比测试项目。这25人被要求在相同任务场景下使用不同的AI模型，并提交详细的评估报告。与此同时，国防部已经在5月内与多家竞争对手AI公司签署了新的合作协议，开始将这些工具部署到机密网络环境中。过渡计划的时间窗口是：6个月。

这不是调查，这是换人流程。

25个人，为什么重要

军方测试，讲究的是具体数字背后的含义。

“25名重度用户”这个表述，在军事采购语境下不是小数目，而是一次认真的内部效能评估。这些用户不是随机抽取的普通行政人员，而是在日常工作中高频率使用AI工具、对模型能力有深度认知的专业人员——情报分析师、作战规划支援人员、政策文件起草者，或者在演习中大量使用Claude的技术岗位。

他们被要求做的事情，是直接将Claude与竞争对手在同等任务条件下进行比对测试。Bloomberg的报道未披露具体的候选模型，但根据已知的军方AI合作格局（以下为基于公开报道的分析推断），最有可能的候选者包括：

OpenAI的GPT系列：OpenAI于2026年5月19日刚刚公开了其与国防部（现更名”战争部”）的合作协议条款（来源：openai.com，可公开访问），主动披露了明确的红线——禁止大规模国内监控、禁止指挥自主武器系统、禁止用于高风险自动化决策。这种透明化策略，恰好是Anthropic被批评为缺乏的东西。
Google的Gemini Enterprise版：Google Cloud已获得FedRAMP High认证，其政府云服务是联邦机构承接机密级工作负载的重要基础设施（来源：Google Cloud公开合规文档）。此处提到的CAISI具体参与情况，为基于公开报道的推断，非官方确认。
其他通过FedRAMP高级认证的专用政府模型：包括Scale AI提供的模型托管服务，以及多家国防科技承包商（Palantir、Anduril等）集成的专有AI系统。Palantir Maven Smart System的军方部署，来源于2022年以来的多篇公开报道（CSIS, Defense One等），具体当前状态为公开信息的综合分析。

这种”平行测试”的设计，本质上是在为一个关键问题寻找答案：如果今天把Claude从工作流里完全拔掉，会发生什么？替代方案能胜任吗？用户能接受吗？过渡成本可控吗？

测试结果将决定6个月过渡计划的具体执行路径，以及哪些工具将成为Claude的长期替代者。

六个月，是宽限还是窗口

“六个月过渡计划”这个措辞，被Bloomberg的报道以相当中性的方式呈现，但它背后包含的信息量远比字面上要多。

六个月，在军方采购节奏里是极短的时间。通常情况下，一个大型IT系统的替换，从需求分析到最终上线，需要数年时间。但六个月的窗口意味着：这不是一个让供应商”来改正”的缓冲期，而是一个让替代方案站稳脚跟的执行窗口。

换句话说：过渡计划已经在执行，而不是在等待。

五角大楼已经在机密网络上部署了新的AI工具。这一细节尤其关键——机密网络（SIPR、JWICS等）上的部署，需要经过严格的安全认证流程，包括FedRAMP授权、国防部IT系统认证（DIACAP/RMF框架）等，不是短期内能随意调整的。

国防部在5月已经签署了与多家AI公司的新协议，意味着竞争对手已经实质性地进入了之前由Anthropic主导的市场空间。这批新协议的规模和具体内容虽然未被公开，但其在时间上与五角大楼宣布替换测试几乎同步，绝非偶然。

OpenAI的精准操作：在正确的时刻，发出正确的信号

就在Bloomberg报道五角大楼测试替代者的同一时间窗口，另一件值得注意的事情发生了。

2026年5月19日，OpenAI在官网主动公开发布了其与美国国防部（战争部）的合作协议条款：

禁止将OpenAI技术用于大规模国内监控
禁止用于指挥自主武器系统
禁止用于高风险的自动化决策场景（如社会信用系统等）

这份文件的战略价值，不在于它划定的红线，而在于它主动公开这些红线的行为本身。

在Anthropic被五角大楼以”供应链风险”为由边缘化的节点上，OpenAI的这份透明度宣示传递了一个清晰的信号：我们能给你们想要的可预测性和可审计性，同时我们主动告诉你们边界在哪里。

这套叙事，比单纯的技术竞争要高明得多。军方客户不仅需要”更好的模型”，他们更需要”可控的模型”——能够事先知道供应商会做什么、不会做什么，能够对模型的行为进行审计，能够在出现问题时进行问责。

OpenAI选择在这个时间点公开协议条款，是一次教科书级别的B2G（Business to Government）市场定位操作。

这件事为什么比所有人想的都更重要

表面上看，这是一个关于Anthropic失去一个政府大客户的故事。

但实际上，它是一个关于”谁有资格为美国军方提供AI”这个底层权力结构问题正在被重新定义的故事。每一家AI公司、每一家依赖单一AI供应商的大型企业组织，都应该仔细读懂这里面的几层含义。

第一层洞察：合规壁垒将成为军用AI的核心护城河

Anthropic被列为供应链风险，核心问题不在于模型能力——Claude在多数基准测试中仍处于第一梯队，Claude 3.7 Sonnet和Claude Code在编程辅助场景尤其突出——而在于以下几个维度的失分：

供应链透明度：美国国防部对AI供应商的要求，不只是”模型好用”，而是”我们知道这个模型是怎么训练的、数据来源是什么、谁在控制它的更新”。Anthropic在这个维度的透明度，显然未达到军方的期望水准。

基础设施控制权：五角大楼内部流传的一个担忧是，Anthropic目前依赖AWS和Google Cloud作为主要算力供应商，而这两家公司本身也是五角大楼的其他IT系统供应商。AI模型的部署基础设施被第三方控制，增加了不可预期的风险链条。

模型更新的可预测性：军方工作流程对AI输出的一致性和稳定性有极高要求。商业AI公司为了竞争，经常进行”悄悄更新”——同一个模型名称下，3个月前的回答和今天的回答可能截然不同。这种不可预测性，在国防场景中是不可接受的。

这意味着，未来军用AI市场的竞争，将不仅仅在技术维度展开，而且将在合规架构、可审计性、基础设施本地化和模型版本锁定等维度展开。这是一个对专注政府/国防市场的AI公司（如Palantir、Scale AI、各家传统国防承包商的AI子公司）极为有利的信号，对通用型大模型公司则是一个必须正视的新挑战。

第二层洞察：这场测试，是企业AI市场的先行指标

五角大楼是世界上对供应链风险最敏感的组织之一，但它不是唯一一个有这种焦虑的组织。

在2026年，各大金融机构、医疗系统、能源公司和关键基础设施运营商，都在问同一个问题：如果我们深度依赖某一家AI供应商，而这家供应商出现问题——无论是监管打压、商业失败、安全漏洞，还是突然改变服务条款——我们的替换成本是多少？替换能完成吗？

五角大楼用”25名士兵的测试”给出了一个示范性答案：你需要提前测试替代方案，而不是在危机发生后才开始找替代者。这六个月的过渡窗口，是”有计划的战略替换”，而不是”被迫的应急响应”。

每一家CIO，看到这则消息后，都应该问自己：如果我们今天要将核心AI工具从供应商A切换到供应商B，我们有多长时间的缓冲期？我们测试过替代方案吗？

第三层洞察：算力绑定，正在成为AI竞争的新维度

Anthropic的故事还有一个背景，因五角大楼的测试而变得格外复杂。

2026年5月21日，SpaceX的IPO招股书（S-1文件）首次公开披露了一个之前仅从侧面报道过的商业细节：Anthropic与SpaceX签署了每月12.5亿美元（年约150亿美元）的算力访问协议，通过2029年5月，总价值约450亿美元。通过这份合同，Anthropic获得了SpaceX在田纳西州孟菲斯Colossus I和Colossus II数据中心的算力资源——超过300MW，22万+张NVIDIA GPU。

这是Anthropic有史以来规模最大的基础设施投入，也是Claude能力提升最重要的算力保障。

但有意思的是：这笔算力，来自Elon Musk旗下的SpaceX——而Musk正是那个在联邦法院与OpenAI的CEO Sam Altman打了数月官司的人，也是通过xAI与Grok直接与Anthropic的Claude竞争的人。

Anthropic付给竞争对手的老板每年150亿美元买算力，用以支撑自己的业务——而这笔钱会支撑SpaceX的AI基础设施建设，间接帮助xAI/Grok的成长。这个商业逻辑的扭曲程度，在AI产业史上大概前所未有。

而对于五角大楼来说，Anthropic的核心算力依赖于一个与竞争对手资本深度纠缠的基础设施，这本身就是一个新的”供应链风险”维度。

谁在填补这个空缺：替换竞赛的参赛者们

五角大楼启动替换测试，意味着一场竞赛已经悄然开始。各家AI公司都清楚这个市场的价值，也都知道拿下军方合同的象征意义——这不仅仅是一份收入，更是整个政府采购生态的入场券。

OpenAI目前处于最有利的竞争位置。5月19日主动公开的协议条款，等于是用一份政策声明换取了信任背书。更重要的是，OpenAI已经在五角大楼的部分非机密项目中获得了实质性部署许可。过去6个月里，他们一直在悄悄地清理合规障碍，为这一刻做准备。

Google的Gemini具有在政府环境中的实际部署经验优势。Google Cloud在联邦政府IT系统中拥有深厚根基，其FedRAMP High认证的政府云服务是承接机密级AI工作负载的重要通道。CAISI框架下的Gemini集成，已经在多个国防承包商系统中测试过一年以上。

Palantir是这场竞赛里最不被外界关注、但内部优势最明显的玩家。Palantir的Maven Smart System（MSS）自2022年起就在为军方提供AI辅助战场管理功能，它的核心优势不在于模型能力，而在于深度集成——它已经和五角大楼的数据管道、指挥系统融合到了几乎不可分离的程度。在这场竞赛里，Palantir卖的不是”更好的Claude替代品”，而是”你需要的不只是一个模型”。

Anduril则代表了另一条路径：不是用通用大模型替换Claude，而是用专为特定军事任务构建的AI系统取代通用AI助手的位置。这对于高度敏感的作战场景来说，可能比任何通用模型都更合适。

这四家公司，加上Nvidia主导的算力基础设施（Anduril 2026年5月完成50亿美元H轮融资，估值610亿美元，其中硬件算力整合是核心投资逻辑），构成了五角大楼AI替换计划最可能的受益者全景图。

Anthropic的处境：最好的时刻，与最难的时刻

Anthropic目前的处境，是一个颇具戏剧性的对比。

在商业维度，公司正在经历成立以来最好的时刻：Q2预计首次实现运营盈利，营收109亿美元，比Q1的48亿美元翻倍以上；Claude Code在开发者社区爆发式增长；企业订阅用户基数快速扩张；SpaceX的算力协议保障了未来3年的基础设施供给。

而在政策与政府市场维度，它正在经历一次严重的信任危机：美国国防部的”供应链风险”标签，是一个在政府采购生态中会产生连锁反应的信号。一旦联邦政府的一个大机构开始主动替换某家AI供应商，其他联邦机构、州政府机构，以及受到联邦法规约束的金融、医疗等行业的采购主管，都会开始重新审视自己的选择。

这种商业成功与政策失利同步发生的局面，揭示了一个Anthropic可能还在摸索的结构性问题：企业级AI市场的成功路径，与政府级AI市场的成功路径，可能要求截然不同的能力组合。

企业级B2B市场需要：模型性能、开发者生态、价格竞争力、集成便利性。

政府级B2G市场需要：合规框架、FedRAMP认证、政治关系、透明协议、可审计基础设施，以及在时间压力下发布明确政策声明的能力。

Anthropic目前在前者已经跑在第一梯队，在后者则暴露出明显的短板。

历史坐标：这不是第一次，也不会是最后一次

AI行业容易让人产生一种错觉：它的发展速度如此之快，以至于一切都是前所未有的。

但军方技术采购里的供应商更迭，有着漫长的历史先例。IBM在1960-1990年代几乎垄断了联邦政府的计算机采购，然后被一批微机厂商和后来的戴尔、惠普逐渐稀释。微软在1990-2010年代主导了政府桌面系统，然后随着云计算的崛起，被迫接受Google和AWS分走了相当大的市场份额。

每一次大的供应商更迭，背后都有一个共同逻辑：现有供应商获得了太大的市场控制权，政府认为这构成了系统性风险，于是主动引入竞争，强制稀释依赖度。

Anthropic的问题，不只是它做错了什么，而是它在AI领域的增长速度太快，快到在军方内部形成了一个”单一供应商主导”的格局，触发了采购风控机制。

这是一个对所有快速成长的AI公司都适用的警示：在B2G（Business to Government）市场，成长速度本身可能成为风险因素。当你的占有率超过某个临界点，你不再只是一个供应商，而是一个需要被”管理”的战略依赖。

五角大楼测试替代方案，从某种程度上说，是在保护自己不过度依赖任何单一AI公司——包括OpenAI、Google，也包括将来可能崛起的任何竞争者。

写在最后：这不是Anthropic一家的问题

五角大楼的这次测试，表面上是Anthropic的公关危机，本质上是整个AI产业从”野蛮增长”向”规范化采购”转型中的一个关键案例。

军方，是最极端也最具参考价值的企业用户。他们的采购逻辑、他们的风险管理标准、他们对供应链可控性的执着，都会在未来几年的时间里，以某种形式渗透到所有对AI依赖度极高的大型机构中。

25名士兵正在测试替代品。这件事，和你的业务可能没有直接关系。

但每一家依赖AI的公司，都应该问自己同一个问题：我们的供应链多元化计划在哪里？我们的替换方案测试过吗？六个月内能完成切换吗？

在AI成为核心基础设施的时代，这不再是”IT采购部门的小问题”，而是每个组织的战略韧性建设的核心议题之一。

参考资料

Bloomberg: “Pentagon Tests Rival AI Models in Race to Replace Anthropic” (2026-05-21) https://www.bloomberg.com/news/articles/2026-05-21/pentagon-tests-rival-ai-models-in-race-to-replace-anthropic
OpenAI: “Our Agreement with the Department of War” (2026-05-19) https://openai.com/index/our-agreement-with-the-department-of-war/
The Verge: “Anthropic is paying $15 billion a year for access to Elon Musk’s data centers” (2026-05-21) https://www.theverge.com/science/935229/spacex-anthropic-ipo-ai-capacity-deal-colossus
Reuters: “Anthropic nears first quarterly profit, agrees to pay SpaceX $1.25 billion monthly” (2026-05-21) https://www.reuters.com/business/anthropic-nears-first-quarterly-profit-agrees-pay-spacex-125-billion-monthly-2026-05-21/
Fortune: “SpaceX finally files IPO prospectus” (2026-05-20) https://fortune.com/2026/05/20/spacex-finally-files-ipo-prospectus-reveals-revenue-is-up-but-losses-are-too/