DeepSeek让$0.87/百万Token成为永久价格:这不是折扣,这是宣战
DeepSeek让$0.87/百万Token成为永久价格:这不是折扣,这是宣战
2026年5月23日,中国AI创业公司DeepSeek在一份低调的公告中宣布:V4-Pro模型的75%促销折扣,永久化。
这句话的重量,要花时间才能感受得到。
输出Token价格:$0.87/百万。输入Token价格:$0.435/百万。
对比一下:GPT-5的输出价格约为$15/百万,Claude Opus 4的价格约为$15/百万,Gemini Ultra约为$12/百万。DeepSeek的价格,是头部竞争对手的1/17到1/10。
这不是促销。这不是补贴吸引用户。当一家公司宣布”永久化”,意味着他们已经找到了在这个价格点可持续运营的方式——或者,他们已经决定,赢得市场比赚钱更重要。这两种可能性,对OpenAI、Anthropic和整个西方AI行业来说,都很麻烦。
一、价格永久化背后的技术逻辑
先搞清楚一个技术事实:DeepSeek V4-Pro是针对华为昇腾950芯片优化的模型。
这不是细节,这是整个故事的关键。
2022年以来,美国对中国的芯片制裁已经切断了华为获得NVIDIA A100、H100、H200等前沿AI芯片的渠道。这迫使中国AI企业走上了一条平行轨道:用华为自己的昇腾系列芯片训练和推理。对大多数观察者来说,这条路被认为是”受限的”——毕竟昇腾在算力密度和软件生态上都落后于NVIDIA。
但DeepSeek做了一件别人没做的事:他们没有在昇腾上”凑合”跑NVIDIA优化的模型,而是重新设计了整个模型架构以适配昇腾的硬件特性。
V4-Pro延续了DeepSeek一贯的混合专家模型(Mixture of Experts, MoE)架构。据行业分析师推断,DeepSeek在针对昇腾的优化方向可能包括:减少跨片通信开销、根据昇腾的内存带宽特点调整批处理策略、以及在推理阶段采用激进的量化方案——这些是在英伟达受限环境下提升推理效率的常见路径,但具体实现的技术细节尚未完全公开。
其结果,可以从最终定价倒推:如果$0.87/百万Token是一个可持续的商业价格(而非政策性亏损补贴),那么DeepSeek的推理成本必然已经大幅低于在NVIDIA H100上运行同等能力模型的成本。加上中国本土的数据中心电价和人力成本优势,整体成本差异可能在5到10倍范围内——这是允许永久性大幅降价的前提条件。
$0.87/百万Token的永久定价,本质上是在说:我们的算力成本已经低到了美国同行的1/10,而且这个优势是可以复制和扩大的。
这让整件事从”价格战”变成了”技术能力的声明”。如果低价建立在真实的效率优势上,而不是亏本补贴,那么等待对手”撑不下去”的策略根本不成立。
二、Artificial Analysis的那张账单
CNBC在DeepSeek降价消息同期引用了AI基准测试公司Artificial Analysis的一项对比数据,这组数字让硅谷陷入了不舒适的沉默:
使用各实验室最强旗舰模型运行相同任务集的年化总成本估算:
- Anthropic Claude Opus 4:$4,811
- OpenAI GPT-5:$3,357
- Google Gemini Ultra:约$2,800
- DeepSeek V4-Pro:$1,071
一年下来,使用Claude的成本,是使用DeepSeek的4.5倍。使用GPT-5的成本,是使用DeepSeek的3倍以上。
对于个人开发者和小型创业公司,这个差距是决定性的。如果你的每月API账单是$400(Claude)vs $89(DeepSeek),这不是”差一点”,这是能不能活下去的问题。
对于大型企业来说,情况更复杂。假设一家企业每年在AI API上的支出是100万美元,切换到DeepSeek可以把这个数字压缩到22万美元,省下来的78万美元可以重新投入到业务。CFO不可能忽视这个差距,尤其是在2026年企业降本增效压力依然巨大的背景下。
但这里有一个关键问题:模型能力真的相当吗?
这是DeepSeek低价策略能否成立的核心。如果V4-Pro比GPT-5或Claude差很多,那价格再低也难以在重要应用场景中替代。
2026年的AI基准测试数据显示,在大多数通用任务(代码生成、文本摘要、问答、翻译)上,V4-Pro与GPT-5和Claude Opus 4的差距已经缩小到可以忽略不计。在数学推理和编程任务上,V4-Pro甚至在某些子测试中超过了GPT-5。
领域特定任务(如医疗诊断、法律合规、创意写作)可能仍存在差距,但对于80%的企业工作负载,”够用”的门槛早已被越过。当”够用”和”便宜10倍”同时成立,市场的迁移力量几乎不可阻挡。
三、OpenAI和Anthropic的IPO困境
时机的残忍在这里显现出来。
2026年5月,OpenAI正在和Goldman Sachs、Morgan Stanley合作准备IPO,目标是2026年9月公开上市。5月18日,联邦陪审团裁定Musk诉讼超过诉讼时效,清除了OpenAI上市的最大法律障碍。Anthropic的IPO计划同样在推进中,两家公司都在同一个时间窗口向市场要估值。
OpenAI的估值约为3000亿美元。Anthropic的最新估值约为9000亿美元(完成300亿美元融资后)。
这两个估值有一个共同的前提:领先的AI模型可以维持相对竞争对手的溢价定价,且这种溢价在可预见的未来是可持续的。
DeepSeek V4-Pro的永久定价,正在攻击这个前提的根基。
投资者对高科技公司的估值,本质上是在押注”可持续的竞争壁垒”。SaaS公司的高估值来自用户黏性和转换成本;平台公司的高估值来自网络效应;领先AI模型公司的估值逻辑,长期以来依赖的是”技术领先 = 定价权”。
如果技术领先变成”能力差不多,但贵10倍”,这个等式就不成立了。
在IPO路演中,每一个机构投资者都会问这个问题:DeepSeek已经把旗舰模型的API价格永久定在你的1/10。为什么企业用户还应该付溢价选你?你的定价权的基础是什么?
OpenAI和Anthropic有几种可以尝试的回答:
回答1:数据隐私和合规性 对于金融、医疗、法律等受监管行业,将数据发送给中国公司存在合规风险。美国政府可能会颁布限制或禁令(已有苗头:美国国务院已就DeepSeek数据安全发出警告)。这个论点在B2G(政府业务)和受监管行业有效,但在一般商业场景中说服力有限。
回答2:生态系统整合 OpenAI已经深度嵌入到Microsoft 365、Azure、GitHub Copilot的工作流中。Anthropic与AWS的深度集成(Claude on Bedrock、AgentCore等)构建了切换成本。但这些生态护城河在API层面依然可以被绕过——用DeepSeek的API替换调用是技术上相对简单的操作。
回答3:持续创新优势 GPT-5和Claude之后还有GPT-6、Claude的下一代,用研发速度保持领先。但在模型能力已经进入”够用区间”的背景下,下一代旗舰模型的增量价值在大多数实际场景中不再是决定性的。
回答4:信任与安全 企业选择OpenAI/Anthropic,是因为他们更信任这些公司的安全实践、可靠性和对齐研究。这是最难量化但可能最真实的护城河——但它能支撑3000亿美元和9000亿美元的估值吗?
这4个回答都有道理,但没有一个能完整、令人信服地解释10倍的价格差距为什么合理。
四、地缘政治视角:这真的只是商业竞争吗
有一种解读,比纯商业分析更令人不安。
美国国务院此前已通过外交电报点名DeepSeek,将其列入AI知识产权窃取风险名单,并在对盟国的外交沟通中表达了数据安全顾虑。这意味着,在华盛顿的战略分析中,DeepSeek不仅仅是一个商业竞争者,而是中国国家战略的一部分。
从这个视角重新审视永久降价决定:
推广华为生态:使用DeepSeek API = 在华为昇腾芯片上运行推理。全球企业的每一次API调用,都是在强化华为昇腾的规模经济和软件生态。DeepSeek的市场份额越大,华为生态的竞争力就越强,这又反过来证明制裁效果的有限性,为华为进一步拓展国际市场提供佐证。
数据收集:当全球开发者用DeepSeek API处理用户数据、商业文档、代码库时,DeepSeek在积累什么样的数据?这个问题没有公开答案,但在军事、医疗、金融等敏感领域,它是一个政策风险。
破坏西方AI产业:如果DeepSeek的低价持续侵蚀OpenAI和Anthropic的商业模式,削弱他们的融资能力和研发投入,最终结果可能是西方领先AI公司的相对实力下降。这与单纯的市场竞争有本质区别。
但这种地缘政治解读也有其局限:DeepSeek是私人创业公司,创始人梁文锋并未表现出明显的政治动机;模型的技术路线本身是开放透明的(DeepSeek一直保持开源传统);如果把每个中国科技成功都归因于”国家意图”,则可能错误地忽视了中国工程师真实的技术创新能力。
事实可能是两者的混合:真实的技术效率 + 战略定价意图 + 客观上服务于国家利益——即使没有明确的政府指令,这三者也完全可以同时成立。
五、谁在这场价格战中受益,谁在受损
受益者1:企业和开发者
API成本的系统性下降意味着什么?意味着更多公司可以在更多场景部署AI,而不必因为成本顾虑放弃可能有价值的用例。一个年营收100万美元的小公司,之前可能因为API成本而无法在产品中内置AI功能;现在,这个门槛大幅降低。
AI普惠化是真实发生的,但它在这个时刻的推动力,是地缘政治竞争,而不是纯粹的技术进步或市场善意。
受益者2:AI基础设施供应商
矛盾的是,DeepSeek低价可能对AWS、Azure、GCP这样的云厂商是利好。更低的模型成本 = 更多的API调用量 = 更多的云计算基础设施需求(存储、网络、向量数据库、监控、安全)。AWS已经报告Bedrock客户同比增长170%,部分原因正是AI使用量的爆炸性增长——价格战加速了这个趋势。
受益者3:非美国、非中国的AI企业
DeepSeek的价格战实际上在加速一个逻辑:如果模型能力可以以极低成本获得(无论是通过DeepSeek API还是通过开源模型),差异化竞争的关键就从”模型本身”转向了”应用层、场景层和数据层”。这对专注垂直应用的企业是利好——他们不需要在模型军备竞赛中与OpenAI/Anthropic正面竞争。
受损者1:以溢价模型定价为核心商业模式的头部AI公司
OpenAI、Anthropic面临的根本挑战不是”DeepSeek更聪明”,而是”DeepSeek让市场重新定义了基准定价”。当用户习惯了$0.87/百万Token的价格,再让他们接受$15/百万,需要极其有说服力的价值主张。
受损者2:试图以AI API为核心商业模式的创业公司
如果你正在构建一个”AI内容生成”或”AI问答”服务,你的商业模式依赖于API价格相对稳定。当最大的竞争压力不是来自你的直接竞争对手,而是来自底层API价格的系统性崩塌,整个赛道的经济学都需要重新计算。
六、OpenAI和Anthropic的可能应对
面对DeepSeek的永久低价,两家公司不可能无动于衷。历史上,当领导者面临颠覆性的价格冲击时,有几种典型策略:
降价跟进:OpenAI和Anthropic都已经多次降低API价格(过去两年OpenAI某些模型降价幅度超过80%)。但如果要跟进DeepSeek到$1/百万的价位,需要对运营成本有根本性的重构,而这可能影响研发投入。
分层定价:将旗舰模型定价保持高位,但推出更多中低端模型满足价格敏感用户(OpenAI的GPT-4o mini、Anthropic的Claude Haiku已在这个方向上)。这是目前最可能的路径,但分层定价意味着高端产品需要提供真正无可替代的差异化价值。
能力差异化:集中投入在DeepSeek相对薄弱的领域(如多模态、复杂推理、工具调用稳定性)建立护城河,让”真正的旗舰应用”只能在OpenAI/Anthropic上实现。
数据与信任护城河:将不可审计、不可解释的中国AI系统带来的合规风险转化为自身的差异化。在GDPR严格的欧洲市场,以及在金融、医疗监管体系内,这个护城河实际上正在变高。
这些策略可以共存,但每一个都需要时间验证——而IPO路演不等人。
七、$0.87永久化之后,下一个”永久”在哪里
有一个让所有人都不敢大声说出来的问题:
如果DeepSeek今天可以把价格永久定在$0.87/百万,18个月后,他们会不会把它定在$0.30/百万?
在AI模型推理成本的历史曲线上,这不是不可能的。随着华为昇腾下一代芯片(据报道昇腾960正在研发中)的成熟,以及模型架构的持续优化,DeepSeek的成本曲线可以继续向下走。
如果这个趋势成立,那么整个AI行业的商业逻辑都需要重写:不是”谁的模型最好”,而是”谁的基础设施成本最低”——而在这场比赛里,拥有国家级芯片制造能力和政策支持的中国玩家,理论上有结构性优势。
这个未来不是确定的。也许华为昇腾会遇到更多技术瓶颈;也许美国政府会对DeepSeek实施更严格的限制;也许GPT-6或Claude的下一代会在能力上拉开真正难以弥合的差距。
但2026年5月23日,随着$0.87/百万Token的永久化,所有这些”也许”都变得更难以依赖。
有一件事是确定的:这是AI行业迄今为止最清晰的一个信号——价格战已经开始,而且它发生在一个对手拥有根本不同成本结构的地方。
当OpenAI的投资者银行家们在2026年9月的路演PPT上展示那个3000亿美元的估值时,他们需要一个令人信服的答案。
$0.87还是$15?这不只是价格的问题。
八、另一层深意:开发者生态的迁移成本
还有一个维度经常被忽略:开发者生态的迁移成本,在API价格面前是多少?
软件行业有一个经典的护城河理论:越是深入集成到企业系统,越难被替代,因为迁移成本太高。这个逻辑对AWS(切换整个基础设施)、Salesforce(切换CRM数据结构)来说非常有效。
但AI API的迁移成本,在这个时代被大大高估了。
如果你在用OpenAI的API,你的代码大概长这样:
response = openai.chat.completions.create(
model="gpt-5",
messages=[{"role": "user", "content": prompt}]
)
切换到DeepSeek?只需要改一行代码:把openai.chat.completions.create换成DeepSeek兼容API的调用,或者修改base_url指向DeepSeek的OpenAI兼容端点。
这就是DeepSeek的另一个战略聪明之处:V4-Pro的API设计完全兼容OpenAI的接口标准。你不需要重写代码,不需要更新提示词工程,不需要重新培训团队。字面意义上,改一个URL就完成迁移。
迁移成本约等于零,价格差距达到10倍。在这种条件下,问题不是”你为什么要迁移”,而是”你为什么不迁移”。
OpenAI深度集成到Microsoft 365生态、Github Copilot工作流、Azure AI Foundry平台的那部分用户,迁移成本确实更高——但这部分用户是整个市场的少数。大量的”纯API调用”用户,面对10倍价格差距,不会有太多犹豫。
九、中国AI企业走到了哪里
DeepSeek的价格战,还有一层更宏观的意义:它是中国AI产业在制裁约束下技术升级的最直接证明。
2年前,业界普遍认为芯片制裁会持续压制中国AI企业的研发能力——没有H100,怎么训练前沿模型?没有先进制程芯片,怎么做高效推理?
DeepSeek V4-Pro的出现,给了这种认知一记响亮的耳光。
不是说制裁没有效果。制裁确实提高了中国AI发展的成本和难度,在某些技术领域造成了明显的滞后。但制裁同时也创造了一个强制性的技术路径:中国工程师不得不找到在更受限硬件上实现更高效率的方法,而这种”被迫创新”,在某种程度上形成了差异化的技术能力。
从更长远的视角看,DeepSeek V4-Pro的意义不只是”又一个便宜的中国产品”。它是一个信号:中国AI产业已经建立了从芯片(华为昇腾)到模型架构(DeepSeek的MoE优化)到部署推理(低成本API服务)的完整闭环,而且这个闭环正在变得更有竞争力。
这对硅谷来说,是一个比”ChatGPT会抢走你的工作”更根本的威胁。
后者只是一个商业产品的竞争故事。前者是一个关于AI技术主权和全球AI产业格局重构的结构性变化。
而这一切,在2026年5月23日的一份”永久降价”公告里,写得非常清楚。
结语:一个关于”足够便宜”的问题
价格战从来不只是关于价格。它是关于谁能够在一个商品化的市场里,找到仍然有差异化价值的锚点。
历史上,每当一个行业进入价格战,最终活下来的公司有两种:要么是成本最低的规模玩家,要么是在价值阶梯上成功爬升到”商品化无法替代”层级的差异化玩家。
OpenAI和Anthropic现在面临的,是这个经典选择的AI版本:你是要成为AI行业的”联想”——追求规模和成本效率,接受利润率的压缩;还是成为AI行业的”苹果”——建立起一个让用户愿意持续为溢价买单的完整体验和生态系统?
这个选择,没有正确答案。但不做选择,才是最危险的。
而让这个选择如此紧迫的,是2026年5月23日,DeepSeek用一句”永久降价”,强行启动了倒计时。
参考资料
- Reuters, “China’s DeepSeek to make permanent 75% price cut on flagship V4 Pro AI model”, 2026-05-23, https://www.reuters.com/world/china/chinas-deepseek-make-permanent-75-price-cut-flagship-v4pro-ai-model-2026-05-23/
- CNBC, “Cheap AI could derail OpenAI and Anthropic’s IPOs”, 2026-05-20, https://www.cnbc.com/2026/05/20/cheap-ai-could-derail-openai-and-anthropics-ipos.html
- TechCrunch, “OpenAI barrels toward IPO that may happen in September”, 2026-05-20, https://techcrunch.com/2026/05/20/openai-barrels-toward-ipo-that-may-happen-in-september/
- CNBC, “Nvidia forecast for $200 billion CPU market includes China”, 2026-05-23, https://www.cnbc.com/2026/05/23/nvidia-forecast-for-200-billion-cpu-market-includes-china.html
- TechCrunch, “Elon Musk has lost his lawsuit against Sam Altman and OpenAI”, 2026-05-18, https://techcrunch.com/2026/05/18/elon-musk-has-lost-his-lawsuit-against-sam-altman-and-openai/