一年沉默,王者回归

2025年初,DeepSeek R1震惊了整个AI行业。一个中国团队,用美国认为”受限”的算力,训练出了性能接近GPT-4o的开源模型,成本仅为同类美国模型的几分之一。

然后,DeepSeek消失了将近一年。

2026年4月24日,DeepSeek回来了,带着V4。

表面上,这是另一次中国AI模型更新——新的版本号,更好的评测成绩,更低的成本,更长的上下文(据Reuters和Fortune报道,V4支持100万token上下文窗口,在agentic coding任务上有显著提升)。科技媒体照例做了性能对比,分析了定价策略,预测了对AI市场的影响。

但如果只看这些,就错过了这次发布最重要的信息:

DeepSeek V4是第一个宣称完整支持华为昇腾芯片的顶级开源模型。

这一行字的重量,远超任何基准分数。需要说明的是:V4的完整技术报告尚未正式发布,以下分析基于已有报道和DeepSeek前代技术报告的推断,部分细节待正式论文验证。

华为昇腾:美国禁令的最大挑战者

理解这一点,需要先了解美国AI出口管制的核心逻辑。

从2022年起,美国商务部逐步收紧了对华高端AI芯片的出口限制。最初针对的是Nvidia A100、H100,后来扩展到H800、A800(专为中国市场设计的”阉割版”),再后来几乎任何算力超过特定门槛的芯片都被纳入管制范围。

美国的战略假设很简单:没有先进AI芯片,就无法训练先进AI模型。 通过切断算力供应,可以维持美国在AI领域的主导地位,并将中国的AI能力限制在不威胁国家安全的范围内。

这个假设在2023年看起来是成立的。2024年仍然大致成立。但2025年DeepSeek R1的出现,开始让人怀疑。2026年DeepSeek V4的发布,则提供了一个更直接的挑战。

华为的昇腾芯片系列——910B、910C、910D——是中国主要的国产高端AI芯片。技术分析普遍认为,昇腾910系列在峰值算力上仍落后于Nvidia H100约30-50%,在推理延迟上的差距更明显。这是一个需要诚实面对的技术现实:华为昇腾还没有追上Nvidia的最新一代芯片。

但DeepSeek工程师找到了一条关键路径:通过算法创新,用次优硬件实现接近最优的效果。

DeepSeek V4据报告在昇腾上的运行效率相比V3版本有大幅提升,在标准AI基准测试的部分测试项上接近同期顶级美国模型(据报道),但目前没有已发布的权威第三方基准测试数字可以直接引用——V4的技术细节需要等待正式报告。关键的是,这是可以用于实际生产部署的系统,而非学术实验。

技术路径:如何在”受限”硬件上缩小差距

基于DeepSeek V3技术报告(2025年发布,DeepSeek在arXiv上的正式论文)以及行业观察,可以推断V4的几个可能的技术路径:

混合专家架构(MoE)的持续演进
DeepSeek V3引入了MoE架构,大幅降低了推理时的算力需求。基于公开报道,V4可能进一步优化了专家路由算法,减少了不同硬件架构间的通信开销。华为昇腾集群的片间互连带宽是性能瓶颈之一,MoE可以减少需要跨芯片传输的数据量。

算子级优化与硬件适配
DeepSeek团队在V3中展示了强大的底层优化能力,包括混合精度计算和自定义CUDA kernel。对于昇腾的适配,类似的工作需要针对华为CANN(Compute Architecture for Neural Networks)框架,将关键算子映射到昇腾的专用指令集。

这些技术路径不是神奇的绕道,而是在次优硬件上做了更多工程工作——代价是更长的开发时间和更高的优化成本,但技术上是可行的。

需要承认的另一面:即使优化得再好,在同等任务上,昇腾版V4与N卡(如H100/B200)之间仍然存在延迟差距,特别是在大批量并发推理场景下。这个效率差距不会凭空消失,只是变得”可接受”而不是”无法使用”。

地缘政治维度:出口禁令的有效性在下降

美国出口管制的核心理论是:AI能力与算力线性相关,控制算力等于控制AI进步速度。

DeepSeek V4挑战了这个线性假设,但也不是完全推翻了它。

更准确的评估是:出口管制仍然有效,但有效性的边界正在收窄。

禁令维持的优势:

  • 在前沿模型的大规模训练上,Nvidia集群仍然有3-5倍的成本效率优势
  • 最新一代Nvidia芯片(如B200)与华为910D之间的能耗比差距仍然显著
  • 美国能够维持在”最前沿一步”的时间窗口,通过禁令来拖慢中国追赶速度

禁令已无法阻止的:

  • 中国训练出”足够好”(而非”绝对最好”)的AI模型
  • 中国建立独立的AI推理部署能力
  • 中国开源模型传播到不依赖美国技术的全球AI基础设施

更危险的趋势是:华为昇腾的软件生态正在因为DeepSeek的适配工作快速成熟。 DeepSeek为V4进行的昇腾优化,客观上为整个开源AI社区贡献了适配经验和工具。下一个模型在昇腾上的适配成本会更低。这形成了一个飞轮效应,将持续增强昇腾的实用价值。

开源的战略意义:比性能更重要的选择

DeepSeek V4和其前身都是开源的。这不只是商业策略,也是一个地缘政治选择。

当一个模型开源时,任何国家的任何开发者都可以下载权重、微调、部署,无需向DeepSeek付款或遵守美国出口管制条款。印度的创业公司、东南亚的企业、欧洲的研究机构——所有这些都可以使用V4,而不依赖美国AI基础设施。

相比之下,GPT-5.5和Claude Opus 4.5都是闭源的,服务器在美国,受美国法律管辖。

开源 + 华为昇腾兼容 = 在理论上绕开美国AI管控的完整替代路径——虽然在效率上仍有差距,但这条路径是技术可行的,且差距在持续缩小。

反驳:中国自身的限制

公平起见,也需要讨论DeepSeek V4路径的内部限制。

监管不确定性:DeepSeek作为私营企业,在中国的运营也受到国内监管要求的约束。中国对AI内容生成的管控要求(如必须通过互联网信息服务算法备案)限制了某些应用场景的自由度。这与”完全自主”的叙事有出入。

训练数据质量:开源权重可以被下载,但DeepSeek的训练数据、RLHF过程和安全对齐细节并未完全开放。从权重到高质量生产部署,企业用户仍然需要大量的工程投入。

持续维护成本:开源模型的发布是一次性的,但持续的维护、安全更新、新版本迭代需要持续的资源投入。DeepSeek的长期开源承诺没有合同约束,商业模式也尚不清晰。历史上有多个开源AI项目在初期热度过后逐渐失去维护支持。

这些内部限制不推翻V4的战略意义,但提醒我们:华为昇腾 + DeepSeek开源 ≠ 一个已经完成的替代体系。它是一个正在建设中的选项,具有真实的战略价值,但也有真实的局限性。任何简单化的”中国已经赶上”或”禁令完全无效”的结论,都是过于草率的。

出乎意料的政策悖论

在讨论禁令有效性之前,有一个极少被讨论的反直觉事实值得关注:

出口管制可能加速了DeepSeek V4的诞生,而不是阻止了它。

逻辑链如下:当Nvidia高端GPU被禁止出口后,中国AI团队不得不在次优硬件上做更多的算法创新——因为他们没有”买更好GPU”的选项。这种约束压力,催生了DeepSeek V3的MoE架构创新(在A100级别算力上达到GPT-4o水准)、DeepSeek V4的昇腾适配优化,以及整个中国AI社区在”效率优先”工程文化上的集体进步。

从这个角度看,美国对中国AI的”物理压制”可能客观上激发了中国AI的”算法超车”动力。这不是为禁令辩护,而是提醒政策制定者:技术竞争的动力学远比”有芯片=有AI能力”的简单假设复杂。 禁令制造的约束,有时候会成为创新的催化剂,这是设计出口管制策略时需要纳入的考量。

DeepSeek V4的发布,改变了AI行业几个重要的底层假设:

对Nvidia的影响
Nvidia的定价权来自于算力稀缺性叙事。DeepSeek每一次在非Nvidia硬件上取得顶级性能,都在侵蚀这个稀缺性。V4不会让Nvidia明天失去定价权,但它是趋势的一部分——未来如果更多模型在昇腾上高效运行,替代成本下降,Nvidia的定价溢价将面临压力。

对开源AI生态的影响
开源AI社区将获得一个在非Nvidia硬件上可运行的顶级模型。在Nvidia GPU算力稀缺的地区——非洲、东南亚、南亚——DeepSeek V4 + 华为昇腾或国产AI芯片,将成为当地AI基础设施建设的可行选项。AI的普惠化进程因此获得了一个新的路径。

对美国政策的挑战
如果芯片禁令的有效性确实在下降,美国的AI竞争策略需要从”控制算力供应”扩展到更多维度:标准制定、数据获取规则、AI应用出口政策、盟国协调等。单一的硬件禁令已经不够。

结论:禁令的逻辑需要更新

美国出口管制是一个严肃的政策工具,有合理的安全考量。但DeepSeek V4的发布,要求诚实地评估其实际效果。

禁令没有做到:阻止中国训练出”足够好”的AI,阻止中国建立部分替代Nvidia的软硬件生态,阻止开源AI绕过管控在全球扩散。

禁令可能仍然做到:减缓而非阻止中国在计算密集型最前沿训练上的进步,维持美国在最新一代GPU算力上的短期技术窗口。

更重要的政策问题是:“减缓”是否仍然是足够有意义的政策目标? 如果差距在3-5年内进一步缩小,禁令的战略价值在何时变得可以忽略?这个问题值得政策界认真讨论,而不是继续依赖一个已经出现裂缝的前提假设。

DeepSeek V4是一面镜子。它照出的,不只是中国AI能力的现状,也是美国科技政策需要更新的部分。禁令的逻辑需要跟上技术现实的步伐,这不是示弱,而是有效竞争的前提。


参考资料

  • Reuters: DeepSeek launches new model with Huawei chip support (2026-04-24): reuters.com
  • Fortune: DeepSeek V4 launches at ultra-low price with Huawei compatibility (2026-04-24): fortune.com
  • DeepSeek V3 Technical Report (2025-01-22): arxiv.org/abs/2412.19437
  • BIS Export Control Regulations: bis.gov(美国商务部工业与安全局)
  • SemiAnalysis: Huawei Ascend 910D Performance Analysis (2026-03): semianalysis.com