如果你向任何一个半导体分析师问”Nvidia最大的竞争威胁是谁”,他们有可能说AMD,可能说英特尔,可能说中国的华为昇腾。

但Barron’s在2026年6月17日发表的一篇分析,提出了一个更反直觉的答案:Nvidia最大的竞争威胁,来自它自己最好的客户

Meta、微软、谷歌、亚马逊。这四家公司,是Nvidia最重要的GPU买家,也是Nvidia市值支撑的最核心来源。同时,这四家公司,都已经在不同程度上部署了自研的AI芯片,并且都在持续加大对自研芯片的投入。

这不是一个未来的假设场景,而是当下正在进行中的现实。

亚马逊的Trainium:从内部工具到外卖产品

最近的一个具体事件,让这个趋势有了清晰的轮廓。

6月18日,亚马逊CEO Andy Jassy在一场会议上表示,亚马逊正考虑对外销售其自研AI芯片Trainium——不再仅用于内部AWS工作负载,而是向外部企业和开发者开放购买或使用。

这条消息,在AI芯片领域的意义堪比地震。

AWS是全球最大的云计算提供商,其内部AI训练和推理工作负载的规模,使Trainium成为了全球使用量最大的非Nvidia AI芯片之一(除了Google TPU和Meta的MTIA)。亚马逊已经证明,Trainium在特定训练任务上可以与Nvidia的H100形成有效竞争——Anthropic就在使用Trainium进行部分训练工作。

如果Trainium开始外卖,这将有两重直接含义:

第一:亚马逊已经对Trainium的生产规模和成本控制有足够的信心,认为在外部市场上具有商业竞争力。这意味着Trainium对Nvidia H100/B200的性价比差距,已经收窄到了可以参与市场竞争的水平。

第二:这是一个规模化的技术信号——芯片研发需要数年和数十亿美元的投入,但一旦这种投入产生了有竞争力的产品,外卖化将迅速把成本摊薄、优化规模效益。Trainium的外卖,是亚马逊多年自研投入开始产生真实商业价值的宣告。

对Nvidia而言,这意味着AWS这个过去只是它最大买家之一的客户,正在成为一个潜在的直接竞争者。

其他超级客户的自研芯片棋局

亚马逊并非孤例。Nvidia的其他核心大客户,都在下类似的棋:

谷歌的TPU(Tensor Processing Unit)是自研AI芯片的最成熟案例。谷歌从2016年就开始部署第一代TPU,如今TPU v5e已经在Google Cloud上对外服务。谷歌内部的AI工作负载——包括Gemini的训练——大量依赖TPU而非Nvidia GPU。在某些特定任务上,TPU的成本效率已经大幅优于等效的Nvidia方案。

Meta的MTIA(Meta Training and Inference Accelerator)是Meta专门为自身AI负载(内容推荐、广告优化、多模态AI)设计的芯片。Meta在2023年首次公开MTIA,随后持续迭代,并宣布其第二代芯片在性能和能效上有显著提升。Meta的目标,是逐步将内部越来越多的AI负载从Nvidia GPU迁移到MTIA,降低对外部供应商的依赖。

微软的Maia(Microsoft AI芯片)是微软在2023年发布的自研AI芯片,专为Azure数据中心的AI训练和推理优化。虽然Maia目前在生产环境中的规模仍有限,但其存在本身就是一个信号:微软不满足于永远依赖Nvidia,正在构建自己的算力主权。

四大超级客户,四条自研芯片路线。这不是偶然的行业趋势,而是一种战略自觉——减少对单一供应商的依赖,增强在定价谈判中的话语权,并在某些关键工作负载上实现更优化的成本和性能。

Nvidia的CUDA护城河:最深也最难绕过的壁垒

理解这个威胁有多严重,需要先理解Nvidia最重要的护城河:CUDA生态系统。

CUDA(Compute Unified Device Architecture)是Nvidia在2006年推出的并行计算平台和编程模型。经过近20年的发展,CUDA已经成为AI研究和开发的事实标准编程环境。全球数百万AI工程师和研究员,都是在CUDA上学习深度学习、训练模型、开发工具的。PyTorch、TensorFlow等主流框架,都将CUDA作为默认的GPU加速后端。

这种生态锁定,不是一个可以被价格或性能差距轻易打破的壁垒。即便Meta的MTIA芯片在特定任务上比H100便宜30%,迁移一个已经在CUDA上高度优化的训练流水线,需要付出巨大的工程成本——重写代码、重新调优、重新验证模型输出的等价性。这种迁移成本,在大多数情况下,会抵消芯片价格差异带来的潜在节省。

这就是为什么,尽管Meta、谷歌、亚马逊都已经有了可用的自研芯片,它们仍然在同时订购大量的Nvidia GPU。自研芯片目前主要用于那些已经有足够工程资源完成迁移的特定工作负载,而不是全面替代Nvidia。

Nvidia的CUDA护城河,给了它一个关键的时间窗口:在竞争对手的自研芯片生态成熟到可以吸收CUDA用户之前,Nvidia有足够的时间保持统治地位。

威胁的时间线:比预期更慢,但不可忽视

现实情况是:超级客户自建芯片对Nvidia的威胁,正在缓慢但真实地积累,而不是像许多分析师预测的那样快速爆发。

几个数据点支持这个判断:

Nvidia的数据中心收入仍在增长。即便在超级客户大力推进自研芯片的背景下,Nvidia 2025财年的数据中心收入达到了数百亿美元,同比增长仍然强劲。这表明,自研芯片还远未达到取代Nvidia的规模和能力。

超级客户仍是Nvidia最大的买家。据估算,Meta、微软、谷歌、亚马逊合计贡献了Nvidia数据中心业务的相当大比例。他们在自研芯片的同时,仍在大量采购Nvidia GPU——因为在最前沿的AI训练任务上,H100和B200仍然是最可靠的选择。

自研芯片的”蚕食”是渐进的。一个更合理的模型是:超级客户会将那些成本高度敏感、不需要最新Nvidia芯片特性的工作负载,逐步迁移到自研芯片。这是一种”蚕食”(erosion),而非”替代”(replacement)。被蚕食的部分,会逐年增长,但Nvidia失去的,是增量而非存量。

这种渐进蚕食,对Nvidia而言,威胁不在于”下一季度收入下降”,而在于”未来5年市场份额天花板被压低”——它不会引起短期股价剧烈震荡,但会在更长的时间维度上影响其增长故事。

Nvidia的战略应对:软件即护城河的深化

面对这种慢速但真实的威胁,Nvidia的应对策略已经清晰:深化软件层的统治地位,让CUDA生态的护城河更难被绕过。

这包括几个维度的努力:

扩展CUDA生态的覆盖范围。Nvidia不断发布新的CUDA库和工具,覆盖更多的AI工作负载类型,使CUDA在AI开发者的工作流中渗透得更深。每一个额外的CUDA工具,都增加了迁移的成本和复杂度。

推进NIM(Nvidia Inference Microservices)等软件产品。Nvidia正在从硬件公司转型为AI软件和服务公司。NIM等产品,让企业可以用标准化的方式部署和管理AI推理服务,同时与Nvidia的芯片深度集成。这种软件层的绑定,比纯硬件供应关系更难被替换。

在下一代芯片性能上持续拉大差距。Nvidia的B200、GB200等新一代芯片,在训练和推理性能上的提升,使自研芯片追赶的技术目标不断移动。当超级客户的自研芯片终于追上H100的性能,Nvidia已经在B200上拉开了新的差距。这是一场永远在移动的靶子游戏。

从Nvidia的困境看AI硬件战略的本质

放在更宏观的视角,Nvidia面临的这个困境,揭示了AI硬件战略的一个核心悖论:最好的客户,永远会成为潜在的最强竞争者

这不是AI时代的独有现象。在云计算时代,AWS的崛起依赖了大量的开源软件(Linux、MySQL等),但也正是AWS的成功,让这些开源软件的支持商(如Red Hat)面临了新的竞争压力——因为AWS可以内化这些工具的价值。

在AI芯片时代,Nvidia依靠超级客户的采购量建立了规模优势,但这些超级客户也在用Nvidia的芯片训练的AI模型,来加速自研芯片的设计优化。谷歌用TPU训练了更好的Gemini,Gemini又帮助谷歌设计了更好的下一代TPU。

这是一个”以子之矛攻子之盾”的循环。Nvidia卖给超级客户的算力,正在被用来制造威胁Nvidia地位的工具。

理解这个循环,是理解AI硬件竞争未来10年最重要的分析框架之一。

对于那些持有Nvidia股票的投资者来说,真正的风险不是明天AMD发布了什么新芯片,而是未来3-5年内,当Meta和谷歌的自研芯片成熟度足以覆盖其50%以上的AI工作负载时,Nvidia的增长曲线将会在哪里转折。

CUDA不是永久的护城河:历史的教训

回顾科技史,曾经看似不可逾越的技术锁定,都在足够长的时间维度上被突破。

Flash存储曾经是闪存行业不可缺少的控制器接口,但NVMe协议的出现,提供了足够标准化的替代方案,让存储行业的生态切换成为可能。Windows的桌面主导地位似乎是永久性的,但移动互联网的到来,让Android和iOS在新的形态上完全绕开了Windows的生态锁定。

CUDA的类似挑战,已经在一定程度上开始出现。OpenAI的Triton,是一种让AI研究者可以在不直接编写CUDA代码的情况下,为GPU(包括非Nvidia GPU)编写高性能计算内核的开源语言。AMD的ROCm生态,正在逐步提升与CUDA的API兼容性,使代码迁移的成本降低。谷歌的XLA编译器,可以将相同的AI计算图优化编译到TPU、GPU乃至CPU上。

这些工具的成熟,都在slowly but surely地降低CUDA的迁移壁垒。不是今天,也可能不是明年,但在未来5-10年的维度上,CUDA的锁定效应会逐渐稀释。

Nvidia深知这一点。这也是为什么,Nvidia在过去两年中,在软件和服务层面的投入比任何以前的时代都更加激进——因为他们知道,硬件的护城河会侵蚀,而软件生态的深度,才是更持久的竞争壁垒。

超级客户自研芯片对Nvidia估值的隐性影响

Nvidia目前的估值,建立在一套复合增长假设上:AI训练需求将持续高速增长,Nvidia将持续吃到这一增长的大部分市场份额,因此收入和利润将持续高速增长。

超级客户自研芯片,并不直接挑战这套假设的第一条(AI训练需求持续增长)——事实上,超级客户对AI的投入越大,对算力的总需求越大。它挑战的是第二条假设:Nvidia将持续吃到市场份额的大部分。

如果Meta的MTIA在未来3年内覆盖其30%的AI工作负载,谷歌的TPU覆盖其40%,亚马逊的Trainium覆盖其25%,Nvidia在这些超级客户处获得的增量订单,将系统性地低于整体AI算力市场的增速。

这不会让Nvidia的收入下降,但会让它的市值增长轨迹,在足够长的时间轴上出现一个向下的折点。对于当前以极高PE倍数定价的Nvidia股票来说,这个折点一旦出现,将带来显著的估值重构压力。

这是为什么Barron’s的那篇文章值得被认真对待——不是因为Nvidia会立刻受损,而是因为当最聪明的钱开始认真对待超级客户自研芯片的威胁时,这个风险在Nvidia的估值中被定价只是时间问题。

未来三年的AI芯片关键变量

要预判这场博弈的走向,有几个关键变量值得持续追踪:

谷歌TPU的对外商业化进度。TPU目前主要用于谷歌内部和通过Google Cloud对外提供服务。如果谷歌决定将TPU对外销售(类似亚马逊正在考虑的Trainium外卖路线),这将是AI芯片市场最重大的游戏规则改变之一。

AMD MI300X和MI350的实际企业采用率。AMD是最有可能在CUDA兼容性上对Nvidia构成直接竞争压力的传统芯片公司。如果MI350在实际部署中的CUDA兼容性和性能达到与H100相近的水平,加速器市场将出现真正意义上的第二选择。

开源AI编译器的成熟度。Apache TVM、OpenAI Triton等项目的进展,将决定”写一次代码,运行在任何芯片上”的愿景,什么时候能够在生产环境中真正实现。一旦实现,CUDA的锁定效应将从护城河变成历史的遗迹。

超级客户自研芯片的”内部市场份额”数据。目前,各超级客户对自研芯片覆盖内部AI工作负载的比例,并不公开披露。随着这些数据逐渐在财报或访谈中浮现,市场将有更精确的模型来评估自研芯片对Nvidia的实际侵蚀速度。

在这些变量的交互演化中,Nvidia与超级客户的博弈,将是未来AI基础设施格局最值得持续观察的动态之一。


参考资料:

  • Barron’s, “Nvidia’s Biggest Threat Isn’t AMD—It’s Its Own Best Customers,” Jun 17, 2026
  • Yahoo Finance, “Amazon CEO Jassy says company could sell AI chips, raising stakes for Nvidia, AMD,” Jun 18, 2026
  • 24/7 Wall St., “Forget AMD: Amazon Declares War on Nvidia by Selling Its Own AI Chips,” Jun 19, 2026
  • 相关背景: 本站2026-06-19: “亚马逊要卖芯片了:当云巨头的内部工具变成市场武器”

参考资料:

  • Barron’s, “Nvidia’s Biggest Threat Isn’t AMD—It’s Its Own Best Customers,” Jun 17, 2026
  • Yahoo Finance / Multiple sources, “Amazon CEO Jassy says company could sell AI chips, raising stakes for Nvidia, AMD,” Jun 18, 2026
  • 24/7 Wall St., “Forget AMD: Amazon Declares War on Nvidia by Selling Its Own AI Chips,” Jun 19, 2026
  • 本文 2026-06-19 发布: “亚马逊要卖芯片了” (2026-06-19-06, 作为背景参考)

Nvidia员工的视角:身处竞争前沿的内部矛盾

站在Nvidia内部看,”最大客户变成竞争对手”的趋势,还带来了一种特殊的组织心理挑战。

Nvidia的工程师和产品团队,每天的工作是帮助Meta、谷歌、微软、亚马逊更好地使用Nvidia GPU,提供最优化的驱动、库和工具支持。与此同时,他们也知道,这些客户正在用Nvidia提供的算力,加速自研芯片的研发。

这种知情而无法回避的矛盾,类似于律师事务所发现其最大客户正在建立内部法律部门,以逐步减少对外部律师的依赖。你帮助他们做得更好,就是在加速自己的边缘化。

Nvidia的应对策略,是将这种不可避免的趋势引导到对自己最有利的方向:不是试图阻止客户自研芯片,而是确保即便在自研芯片时代,CUDA生态和Nvidia的软件工具,仍然是开发者的默认选择。将自己从”芯片供应商”升级为”AI开发基础设施提供商”——即便客户用的不是Nvidia的GPU,也还是在Nvidia的软件生态里工作。

这是”你可以不买我的铁,但你得用我的锤头”的策略。能否成功,取决于软件层护城河能否先于硬件层护城河被侵蚀前,完成足够深的生态绑定。

结语:Nvidia是这个时代最被误读的公司之一

大多数关于Nvidia的讨论,要么过分乐观(AI算力无限增长,Nvidia永远稳赢),要么过分悲观(超级客户一旦自研芯片,Nvidia就会崩盘)。

真实情况,更加微妙也更加复杂。

Nvidia拥有当今科技产业最强的几个护城河之一——CUDA生态的深度,是任何后来者都需要花费多年时间和数百亿美元才能撼动的资产。与此同时,超级客户自研芯片的趋势,是不可逆的战略选择,会在未来五到十年内系统性地压低Nvidia在最大客户处的市场份额天花板。

这两件事可以同时为真。Nvidia可以在未来几年继续是AI基础设施领域最重要的公司,同时,其市场份额的长期轨迹将面临不可忽视的天花板压力。

理解这种微妙性,是做出准确AI产业判断的必要条件。Nvidia的真正对手,不是AMD,而是它自己最大客户们对技术自主权的战略渴望——这种渴望,会在足够长的时间维度上,以足够慢的速度,但也以足够确定的方式,重新塑造AI芯片市场的竞争版图。

附录:AI芯片自研的技术门槛有多高

理解超级客户自研芯片的威胁程度,还需要正视一个经常被低估的技术现实:设计一款可以在生产环境中大规模部署的AI芯片,难度远超大多数人的想象。

GPU的设计需要数千名工程师工作数年,需要与台积电、三星等代工厂建立深度的工艺合作关系,需要构建完整的软件工具链,还需要在实际的大规模部署中积累无数的调试经验。英特尔在进入GPU市场多年后,其Gaudi系列芯片仍然在稳定性和软件生态上与Nvidia存在显著差距——这是一家拥有数十年芯片设计经验的公司的结果。

谷歌、亚马逊、Meta在自研芯片上的成功,很大程度上源于他们可以将芯片的优化目标高度聚焦:他们不需要为所有应用场景设计通用芯片,只需要为自己内部最具代表性的工作负载(谷歌的Transformer训练、Meta的推荐系统推理)设计专用芯片。这种专用化,使他们在特定场景下能够超越Nvidia的通用GPU——但也意味着,他们的芯片很难像Nvidia那样服务于多样化的外部客户需求。

这是自研芯片对外销售面临的最大挑战:当你把内部优化的专用芯片卖给外部客户,你需要面对这些客户完全不同的工作负载需求。亚马逊的Trainium如果要真正向外销售,需要在软件生态、场景覆盖广度上做出大量超出内部使用范围的额外投入。这也解释了为什么Trainium外卖的消息,会让市场感到意外——因为这意味着亚马逊认为Trainium已经达到了足以服务外部多样化需求的成熟度,这是一个不小的技术里程碑。