英伟达芯片走私案加上OpenAI削减GPU订单:AI硬件供应链的三重暗战
2026年3月23日,两条方向截然相反的新闻同时出现在科技版面上。一边是Super Micro联合创始人廖义贤因涉嫌通过伪造文件和空壳公司向中国走私价值25亿美元的英伟达芯片而被联邦大陪审团起诉,Super Micro股价当日暴跌12%(来源:聚合报道,2026年3月23日)。另一边是OpenAI正在主动削减对英伟达显卡的采购订单并重新评估其数据中心全球扩张计划(来源:新浪新闻中文报道,2026年3月23日)。
1个冒着联邦重罪的风险拼命往外偷运芯片。另1个是全球估值最高的人工智能公司在主动减少芯片的采购数量。两条新闻并置在一起,揭示了人工智能硬件供应链表面平静之下同时进行的三重暗战——地缘科技管控的攻防战、算力成本的博弈战、以及技术路线的分叉战。
第1重暗战:25亿美元走私案背后的地缘芯片战争
先审视走私案的规模和手法。联邦检察官的起诉书指控廖义贤在2022年至2025年间,利用其作为Super Micro联合创始人的行业关系网络和供应链资源,通过系统性地伪造最终用户证书并在新加坡和阿拉伯联合酋长国设立多家空壳服务器采购公司,将英伟达A100、H100和B200系列高端人工智能显卡转运至中国客户手中。涉案金额约25亿美元(来源:聚合报道综合联邦起诉书内容,2026年3月23日)。
25亿美元在芯片贸易的语境中意味着什么?按照H100芯片约2万5千美元的市场价格换算,这批走私的芯片数量大约相当于1010000块高端人工智能显卡——足以组建1个可以训练第4代聊天机器人级别的超大模型的完整计算集群。这不是某个小贸易商的灰色倒卖行为——这是1个由行业核心人物主导的系统性出口管制规避工程。
这个案件的地缘背景需要追溯到2022年10月。当时美国商务部BIS发布了对华芯片出口管制新规,禁止向中国出口算力超过特定阈值的人工智能芯片——最初的管制清单覆盖了英伟达的A100和H100系列,后来扩展到降级版的A800和H800(来源:美国商务部BIS EAR,2022年10月)。英伟达为了在合规框架内保住中国市场,专门设计了算力阉割版的A800和H800芯片。但阉割版和满血版之间的性能差距——尤其在训练大规模前沿模型时的效率差距——意味着中国的头部人工智能实验室在使用合规芯片时面临着显著的算力劣势。
这种由管制人为制造的算力劣势催生了强烈的走私需求。但廖义贤案的特殊性在于犯罪嫌疑人的身份级别——他不是某个不知名的中间贸易商或地下渠道运营者,而是Super Micro的联合创始人。Super Micro是全球最大的人工智能服务器制造商之一,4财年收入约150亿美元(来源:Super Micro4财年年度财务报告),其客户名单包括Meta、微软、亚马逊云计算等全球最大的人工智能基础设施买家。1家核心供应链企业的创始级人物涉嫌大规模走私——这说明出口管制的漏洞不在产业链的边缘和末端,而在最中心的位置。
第2重暗战:OpenAI为什么主动减少显卡采购
在芯片走私的另一面,OpenAI的动作同样出人意料。
据中文媒体报道,OpenAI正在缩减向英伟达采购显卡的规模并重新评估其全球数据中心的扩张节奏(来源:新浪新闻,2026年3月23日)。在全球人工智能军备竞赛白热化的当下——各大实验室都在拼命囤积算力——全球估值最高的人工智能公司主动做出减少核心硬件采购的决定,这显然不是1个常规操作。
要理解这个决定,需要逐一分析三种可能的动机。
第1种解释是上市前的财务纪律展示。OpenAI正在从非营利组织结构向营利性公司结构进行历史性的转换,最新估值已经达到约8400亿美元(来源:聚合报道,2026年3月23日)。在即将面对公开资本市场投资者的时间节点上,”成本控制”比”算力规模”更能传递管理层的财务审慎信号。参考前车之鉴——金融科技公司上市首日即下跌27%的惨痛案例(来源:英国金融时报,2026年3月)——OpenAI的管理层有充分的动力在财务叙事上提前做好准备。
第2种解释是推理效率的技术突破使得同等服务容量所需的显卡数量下降了。第5点四代聊天机器人及其后续模型在推理效率上实现了代际级别的提升。如果每个令牌的计算成本大幅下降,那么维持相同的用户服务容量和模型调用吞吐量所需的显卡集群规模自然可以缩减。StepFun同一天开源的Step 3.5 Flash模型提供了1个生动的例证——这个总参数量达1960亿但每次推理只激活110亿参数的稀疏混合专家架构模型,可以在消费级硬件上流畅运行(来源:新浪,2026年3月23日)。如果OpenAI内部也在推进类似的推理效率优化,那减少显卡采购就是技术进步的自然结果,而非战略收缩的信号。
第3种解释是供应链多元化战略——OpenAI可能不是在减少总算力投入的绝对值,而是在将采购份额从英伟达1家分散到多家供应商。AMD的Instinct系列显卡在性价比上正在缩小与英伟达的差距。谷歌的TPU第6代在特定推理工作负载上已经展现出成本优势。更关键的是——微软作为OpenAI最大的投资者和基础设施提供商,已经在2025年发布了自研的”迈亚200”人工智能芯片(来源:微软技术大会,2025年11月)。如果OpenAI的部分推理工作负载正在从英伟达显卡迁移到微软自研芯片上,那对英伟达的采购订单自然会相应缩减。
三种解释并不互斥——它们很可能同时在起作用,只是权重不同。
第3重暗战:人工智能硬件的”去英伟达化”长期趋势
把走私案和显卡削减放到更宏观的产业背景中观察,1个更深层的结构性趋势变得清晰可见——人工智能硬件供应链正在经历不可逆的”去中心化”进程。
英伟达在人工智能显卡市场的份额约为80%到90,取决于统计口径是只看训练芯片还是包括推理芯片(来源:Mercury Research,2025年第4季度)。这种程度的垄断地位带来了两个系统性问题。第1是供应链的脆弱性——当全球人工智能计算能力的咽喉被1家公司控制时,任何供应中断——无论是地缘政治封锁、产能瓶颈还是走私丑闻导致的声誉和合规危机——都会波及整个产业。第2是定价权的滥用风险——英伟达的B200系列显卡定价预计超过4万美元1块,这个价格已经使许多中小型人工智能公司和研究机构望而却步。
应对策略正在多条产业线路上并行推进。AMD的本能300系列在性价比上正在快速逼近英伟达。谷歌的TPU第6代在特定推理工作负载上已经比英伟达显卡更具成本效率。博通以及多家芯片设计初创公司正在为特定的人工智能工作负载定制专用集成电路。亚马逊的Trainium 2正在其云计算平台上大规模部署。华为的昇腾系列——虽然在软件生态上仍然远落后于英伟达的CUDA——正在中国国内人工智能公司中获得越来越多的采用。
走私案最具讽刺意味的地方恰在于此——它以一种极端的方式证明了英伟达垄断地位的根深蒂固。即使在严厉的出口管制之下,客户仍然甘冒联邦重罪的风险去获取英伟达芯片,而不是转向合法的替代品。中国的人工智能实验室理论上可以使用华为的昇腾1乙芯片——但在软件生态的成熟度上,英伟达的CUDA与华为的自研计算框架之间存在着数年的差距,这使得训练前沿超大模型时使用替代方案的实际效率远低于英伟达原版。
大多数人没看到的:芯片管控正在从反面重塑人工智能的技术路线
走私案和显卡削减表面上看是供应链和商业决策的故事。但把它们放到更长的时间线上审视,1个更深刻的因果关系浮现了——芯片供应约束正在从根本上改变人工智能技术的发展方向和优先级。
当高端显卡变得昂贵且供应受限时,人工智能研究的重心自然而然地从”堆积更多显卡来训练更大的模型”转向”用更少的计算资源做出更多的成果”。StepFun的Step 3.5 Flash模型就是这个趋势的典型产物——1960亿总参数中每次推理只激活110亿,在英伟达最新架构的显卡上可以达到每秒100到350个令牌的推理速度。Knowledge Distillation技术把大模型的能力压缩到小模型中、量化技术把浮点运算精度从32位降到8位甚至4位、稀疏推理技术让模型在每次计算时只激活一小部分参数——所有这些效率优化技术的研发热潮,本质上都是对”显卡不够用”这个硬约束的创造性回应。
这里有1个极具讽刺性的地缘政治悖论。中国人工智能社区在推理效率优化方向上可能反而走在了全球前列——恰恰是因为出口管制限制了他们获取顶级显卡的渠道,中国的人工智能研究者被迫把更多精力投入到”如何用有限算力做更多事”的方向上。DeepSeek的DeepSeek-VL2模型、Qwen 2.5系列模型在推理效率上的多项突破,某种程度上都是”被制裁逼出来的创新”。
这构成了1个经典的”反脆弱”现象——试图通过限制硬件供应来遏制对手人工智能能力的政策,反而催生了更高效的人工智能技术路线。长期来看,这可能导致1个意想不到的结果:中国的人工智能系统在推理效率指标上优于美国——因为美国的人工智能公司拥有充足甚至过剩的显卡供应,”暴力堆算力”始终是1个在短期内更省事的选项,而中国公司被迫走上了”精打细算”的技术优化之路。当然,这并不意味着管制是无效的——在训练最前沿的超大模型方面,算力总量仍然是决定性的瓶颈。但在大模型部署和应用层面,效率优化的先发优势可能会转化为真实的商业竞争力。
这意味着什么:人工智能硬件供应链的新地缘现实
对于整个人工智能行业的所有参与者来说,三月23日这一天的两条新闻共同传递了1个清晰的信号——人工智能硬件供应链正在从纯粹的技术和商业问题演变为地缘政治问题。芯片不再只是计算设备,它已经成为国际权力博弈的棋子、出口管控的核心对象、供应链安全的最关键软肋。
对于中国的人工智能公司来说,走私不是也不可能是长久之计。25亿美元案件的公开起诉说明美国的执法力度正在系统性升级——从海关拦截升级到了联邦大陪审团起诉核心人物。自主芯片生态能力的建设——华为昇腾系列的持续迭代、寒武纪和壁仞等国产芯片的追赶——其战略紧迫性不是在降低,而是在进一步加强。
对于美国的人工智能公司来说,英伟达的垄断地位既是效率的保障也是风险的来源。OpenAI削减显卡订单——无论出于什么动机组合——都应当被解读为1个”不要把所有鸡蛋放在同1个篮子里”的战略信号。多元化供应链不是1个遥远的理想目标,而是1个正在被行业领导者付诸实践的紧迫行动。
对于英伟达自身来说,走私丑闻和客户主动分散采购在同一天汇聚,构成了1个微妙的战略时刻。短期内全球人工智能资本支出仍在快速增长——2025年全年超过21000亿美元(来源:研究机构预测,2025年12月)——显卡需求依然旺盛。但长期的”去英伟达化”趋势已经从概念讨论进入了实质执行阶段,这个趋势是不可逆的。
25亿美元的芯片走私案和OpenAI的显卡订单削减,是同一枚硬币的正反两面——它们共同指向1个新的现实:人工智能硬件供应链正在进入1个更复杂、更政治化、也更不可预测的新阶段。在这个新阶段里,技术能力、商业算计和地缘博弈三股力量交织在一起,没有任何一方能够单独决定走向。
参考资料
- Co-founder of tech company charged with diverting $2.5 billion in Nvidia AI chips — CNN, 2026年3月19日
- Super Micro’s Liaw exits board following AI chip smuggling charges — Reuters, 2026年3月20日
- Nvidia CEO Huang says $30B OpenAI investment ‘might be the last’ — CNBC, 2026年3月4日
- StepFun开源Step 3.5 Flash: 196B稀疏MoE模型 — 新浪, 2026年3月23日
- Bureau of Industry and Security Export Controls — 美国商务部BIS, 2022年10月