2026年5月26日,市场研究机构TrendForce发布了一组数据,在半导体行业的观察者中引发了广泛讨论:2026年定制AI芯片(ASIC)的出货增速,接近商用GPU的三倍。

这是一个乍看之下难以置信的数字——Nvidia一直是AI基础设施领域最受关注的公司,H100/B200 GPU供不应求,黄仁勋的财报电话会是全球科技媒体的头条。但TrendForce的数据揭示的是一个Nvidia神话之外的故事:在GPU的高光时刻,另一类芯片正在以更快的速度扩张。理解这个现象,需要理解AI计算经济学正在经历的一次根本性转变。

同一天,来自金融媒体的报道显示,AI超大规模企业(Hyperscalers)今年的资本支出预计将达到7250亿美元,大部分用于数据中心及芯片硬件。费城半导体指数(PHLX Semiconductor Index,PSI)创下历史新高,Nvidia和Broadcom领涨,均报告了强劲的AI相关收入增长。(来源:Yahoo Finance,2026-05-26)

表面上看,这两条消息是矛盾的:一方面ASIC增速是GPU的三倍,另一方面Nvidia领涨半导体指数。但实际上,它们共同描述了AI芯片市场正在经历的一次结构性转变——一场「通用算力」与「专用算力」之间的权力再分配。

理解这场转变,需要先理解「ASIC出货增速3倍于GPU」这个数字背后的产业逻辑。


第一章:什么是ASIC,为什么它开始反超GPU?

ASIC(Application-Specific Integrated Circuit,专用集成电路)与GPU(图形处理单元)的核心区别,在于「通用性」与「专用性」的权衡。

GPU是通用矩阵运算加速器。它的设计哲学是「一块芯片,服务所有AI工作负载」——无论是训练大语言模型、推理图像识别、运行推荐系统,还是跑游戏的光线追踪,Nvidia的A100/H100/B200都能处理。这种通用性带来了巨大的市场规模(几乎所有AI工作负载都可以用GPU),但也意味着不可避免的效率损耗——对于特定工作负载,通用设计会留下大量计算能力的浪费。

ASIC是专用芯片。它的设计是为某一特定类型的计算任务量身定制的——比如Google的TPU(Tensor Processing Unit)专门为TensorFlow的矩阵乘法优化;Amazon的Trainium专门为深度学习训练;Meta的MTIA(Meta Training and Inference Accelerator)专门为推荐系统。在这些特定任务上,ASIC的能耗效率(每瓦特算力)可以比GPU高出3到5倍,成本效率更是数量级的差异。

那么,为什么AI行业在前几年主要用GPU,而现在ASIC开始加速?

原因一:AI工作负载的成熟化

2022年-2024年,AI行业主要在做「探索」——不同的模型架构、不同的训练方法、不同的推理优化技术。在这个阶段,通用GPU的灵活性是刚需:工程师需要快速实验、快速迭代,不能被特定硬件束缚。GPU的通用性是探索期的最优解。

但到了2025年-2026年,AI行业的主要工作负载开始稳定化:大量企业正在将已经验证的模型(Llama 3、Claude 3、GPT-4的变体)大规模部署用于推理(inference)。推理工作负载的特点是:固定模型、高频调用、延迟敏感、成本敏感。这个特征非常适合ASIC:你已经知道要算什么,定制一块专门算这件事的芯片,效率远高于通用GPU。

原因二:超大规模企业的成本压力

当Google一年要处理数万亿次AI推理请求,当Meta的推荐系统每天要为数十亿用户实时运行,GPU的成本开始变得不可接受。Google的TPU v5已经被证明在Google自有工作负载上的成本效率是H100的2-3倍。Amazon的Trainium 2在某些训练任务上,单位成本比H100低30%-40%。Meta的MTIA在推荐系统推理上,能耗效率是GPU方案的数倍。

这些数字,驱动着超大规模企业把越来越多的AI计算从GPU迁移到自研ASIC。而超大规模企业的体量(Google、Amazon、Meta、Microsoft加在一起,占全球AI芯片采购的50%以上),决定了ASIC出货量增速超越GPU是必然趋势,只是时间问题。

原因三:Broadcom和AMD的崛起

不是所有公司都有能力像Google那样自研芯片。对于没有芯片设计能力的中型科技企业,Broadcom提供了「定制ASIC代工」服务——企业提供工作负载需求,Broadcom设计并制造专用AI芯片。

Broadcom在2026年Q1的财报中披露,AI相关收入同比增长超过100%,其中定制ASIC业务是主要驱动力。客户包括Google(TPU设计委托)、Meta(部分MTIA设计委托)以及多家中型超大规模企业。

AMD则通过MI300X和MI350系列GPU加速芯片,以及收购AI ASIC设计公司Pensando,在「比Nvidia便宜、比纯ASIC灵活」的中间市场建立存在。


第二章:这不是「替代Nvidia」,这是「开辟新市场」

在这里需要澄清一个常见的误解:ASIC增速超越GPU,不意味着Nvidia即将被取代。

这是两个重叠但不完全相同的市场:

Nvidia的主战场:前沿模型训练(H100/B200集群)、通用推理部署、中小型AI工作负载。这些场景的共同特点是「工作负载多样、需要灵活性、没有足够规模来定制ASIC」。

ASIC的主战场:大规模重复性推理(搜索推荐、广告排名、内容审核)、超大规模企业自用工作负载、成本极度敏感的高频计算。这些场景的共同特点是「工作负载固定、规模巨大、ROI可精确计算」。

TrendForce的数据告诉我们的是:ASIC这个「新市场」正在以GPU主战场3倍的速度增长。这不是存量市场的替代,而是增量市场的爆发。

为什么增量市场在爆发?因为AI推理的规模正在以指数级扩大。

2025年,全球AI推理请求量大约是训练请求的10倍。到2026年底,这个比例预计会超过100倍——因为越来越多的消费者应用(搜索、客服、推荐、个人助理)都在后台跑AI推理。这个规模增长,正好落在ASIC最有竞争力的场景里。

简单来说:训练大模型,还是要用Nvidia的GPU集群;大规模跑推理,ASIC正在成为更经济的选择。而AI的未来,推理规模会是训练的数百倍。这意味着ASIC的市场空间,从结构上看,会比GPU大。


第三章:Google TPU的领先地位与战略意义

在所有ASIC玩家中,Google的TPU是理解这场转变最好的窗口。

Google在2016年就开始内部使用TPU——比任何其他大型科技公司的定制AI芯片项目早了至少5年。到2026年,Google已经迭代了6代TPU,最新的TPU v6(Trillium)在Google内部的AI工作负载上的能耗效率,据称是H100的4倍以上。

更重要的是,Google正在通过Google Cloud把TPU的算力向外部客户开放。对于一个使用Google Cloud的企业来说,调用TPU实例进行AI训练或推理,在特定工作负载下比使用A100/H100实例便宜50%-70%。

这对Nvidia的云端GPU租用业务(通过AWS、Azure、Google Cloud等云平台销售GPU算力)是一个直接的竞争威胁。当Google Cloud的TPU实例在Gemini相关工作负载上明显更便宜,企业客户会自然地考虑:我的工作负载是否可以迁移到TPU?

答案越来越多是「可以」——因为JAX、TensorFlow等框架对TPU的支持已经非常成熟,迁移成本在过去两年大幅降低。


第四章:$7250亿资本支出与半导体指数新高的悖论

现在回到那个看似矛盾的数据:如果ASIC在「蚕食」GPU市场,为什么Nvidia还能领涨半导体指数?

答案是:$7250亿资本支出的蛋糕太大了,而且两类芯片都能分到足够多的份额。

$7250亿里,大约有1500-2000亿美元用于AI芯片购买(其余是数据中心建设、网络设备、存储等)。在这1500-2000亿美元的AI芯片支出中:

  • 大约30%-40%流向了ASIC(Google TPU内部用、Broadcom定制给各大客户、Amazon Trainium自用)
  • 大约60%-70%仍然流向了Nvidia GPU(用于前沿模型训练、通用推理、中小规模部署)

ASIC的「增速更快」,是说它的增速比GPU快;不是说它的绝对数量已经超过GPU。在600-800亿美元的ASIC市场里,增速3倍于GPU意味着明年可能是1200-1800亿;而GPU仍然是一个超过1000亿美元的年度市场,并且仍在增长。

蛋糕在变大,切法在改变。Nvidia是最大的受益者,Broadcom是ASIC时代的新晋受益者,Google/Amazon/Meta通过自研ASIC节省了大量成本(这个「节省」不体现在市场规模里,但体现在它们的利润率里)。

PSI指数创历史新高,是因为整个AI芯片需求的绝对规模在扩大,所有玩家都受益,只是增速不同。


第五章:大多数人没有看到的深层转变

这场ASIC vs GPU的数据,背后有一个更深层的结构性转变值得关注:AI的计算经济学正在从「暴力通用」走向「精准专用」。

在2020年代初期,AI的主流范式是「大力出奇迹」——更大的模型、更多的GPU、更长的训练时间,就能得到更好的结果。这个范式天然利好Nvidia:买更多H100,效果就更好。

但到了2025年-2026年,一个新的范式正在形成:「高效推理」比「强力训练」更重要。原因是经济规律:

  • 训练一个GPT-4级别的模型需要数亿美元,只需要做一次(或少数几次)
  • 用这个模型服务数十亿次用户请求,每次的推理成本累计起来是训练成本的数百倍

当推理成本成为AI落地的主要经济壁垒,优化推理效率的ASIC就变成了比优化训练能力的GPU更重要的战略资产。

这解释了为什么Google、Amazon、Meta愿意花数十亿美元投入ASIC设计——每节省一分推理成本,乘以数十亿次日请求量,累计下来是数亿美元的运营成本差距。

这也预示了Nvidia未来可能面临的最大挑战:不是来自竞争对手的GPU(AMD MI350还差得远),而是来自大客户「自建或定制ASIC」的战略转移。当Google、Amazon、Meta,这三家每年合计从Nvidia购买数百亿美元GPU的超级客户,有越来越多的工作负载迁移到自研ASIC,Nvidia的增长曲线会开始出现结构性拐点。


第六章:中小企业的ASIC时代还有多远?

当然,目前的ASIC主要服务于超大规模企业——Google、Amazon、Meta这种体量的公司,才有能力承担定制芯片的研发成本(通常是数亿美元的一次性投入)。

对于年AI算力支出在1000万美元以下的中型企业,GPU仍然是唯一现实的选择:没有规模,ASIC的固定研发成本摊销不开。

但这个局面在2026年开始出现变化:

Broadcom的「ASIC-as-a-Service」模式在悄悄降低门槛——企业不需要自己拥有芯片设计能力,可以把工作负载需求交给Broadcom,由后者设计并制造专用ASIC。这种模式把ASIC研发门槛从「自建百人芯片团队」降低到「能清晰描述工作负载需求并有足够规模」。

云端ASIC实例正在成为中小企业的入口——通过Google Cloud调用TPU实例、通过AWS调用Trainium实例,中小企业可以在不购买硬件的情况下使用ASIC的算力优势。这是一种「ASIC的云端民主化」。

推理专用AI芯片的创业公司(如Groq、Cerebras、SambaNova)正在为那些对延迟极度敏感(如实时对话AI)的场景,提供专用推理芯片解决方案。这些公司的目标客户,正是被Nvidia在推理效率上「服务不足」的中型AI应用企业。


结语:三倍增速的真正意义

TrendForce的数据是一个里程碑,但它的意义不在于「Nvidia要完了」(Nvidia并没有要完),而在于它标志着一个拐点:AI芯片市场从「Nvidia一家通吃」走向「通用GPU+专用ASIC双轨并行」的新格局。

这个格局对整个AI产业有深远影响:

对于超大规模企业:ASIC自研是战略必需品,不是可选项。计算成本决定了AI应用的边际经济,自研芯片是唯一能持续优化这个边际的路径。

对于中型AI公司:在最优先的核心工作负载上,值得开始评估ASIC路径的可行性(通过Broadcom代工或云端ASIC实例);其余工作负载继续用GPU。

对于投资者:ASIC时代的受益者不只是芯片公司——芯片设计IP公司(ARM、Cadence、Synopsys)、先进封装公司(台积电的CoWoS技术)、高带宽内存公司(SK Hynix、Micron的HBM),都将从AI ASIC的繁荣中分得一杯羹。

对于Nvidia:真正的威胁不是来自明天,而是来自五年后——当越来越多的推理工作负载迁移到ASIC,Nvidia的增长引擎需要找到新的第二曲线(Sovereign AI、工业AI、Robotics算力),否则会在最大的存量市场(超大规模推理)遭遇天花板。

AI芯片的历史,正在从「速度时代」走向「效率时代」。三倍增速,是这个转变的第一个可量化的信号。

从投资回报的角度,这个转变的含义是:如果你在2022年买入Nvidia股票,你是在押注「训练时代的通用算力需求」;如果你在2026年重新评估AI芯片投资,你需要同时考虑「推理时代的专用算力」——两者的底层驱动力不同,但在这个转型阶段,整个AI芯片生态都在增长,只是增速的分配在变化。聪明的投资者,会在Nvidia继续上涨时,同时建立对Broadcom、台积电CoWoS封装、HBM供应商的分散持仓,以覆盖ASIC时代的受益链条。



第七章:ASIC时代的中国因素

在讨论ASIC出货增速超越GPU时,有一个不可忽视的地缘政治维度:中国的AI芯片战略。

美国对华出口管制已经有效切断了中国市场对Nvidia先进GPU(H100、H800系列及其后继)的访问。Jensen Huang在2026年5月21日表示,Nvidia已「基本让出」中国AI芯片市场给华为(来源:CNBC,2026-05-21)。

这个真空正在被华为的昇腾(Ascend)系列ASIC填补。华为昇腾910C、昇腾910B在中国的AI训练市场,估计已经占据了30%-40%的份额——这些份额完全是由出口管制创造的「政策性市场」。

从全球ASIC出货增速的角度,中国市场的华为昇腾是一个不可忽视的贡献因素。TrendForce的「ASIC增速3倍于GPU」数据,在一定程度上包含了中国本土ASIC的放量,而这个放量的直接驱动力是美国的出口管制。

这创造了一个有趣的悖论:美国希望通过出口管制限制中国AI能力的发展,但这个政策的直接结果之一,是加速了中国自研ASIC产业链的成熟——反而在长期推动了中国的「AI芯片自主化」进程。

从行业投资的角度,这意味着全球ASIC市场的增速,部分来自于「分裂」(decoupling)而非「融合」(convergence)。东西方AI计算生态的分叉,会使全球ASIC市场总量更大,但也意味着技术生态的碎片化。


附录:理解ASIC增速的数字框架

对于非半导体专业的读者,这里提供一个简化的框架来理解「ASIC出货增速3倍于GPU」的实际含义。

基准数字(估计值,基于公开数据推算)

  • 2025年全球AI GPU(主要是Nvidia)出货约250-300万块
  • 2025年全球AI ASIC出货等效算力,折算成标准单位,约为GPU的20%-30%

增速含义

  • 如果GPU 2026年出货增速为+30%(保守估计),则约320-390万块
  • 如果ASIC出货增速是GPU的3倍,即+90%,则等效算力约为GPU的35%-50%

这意味着:到2026年底,全球AI计算总量中,来自ASIC的贡献将从约25%上升到约35%-40%。这不是简单的「ASIC替代GPU」,而是「ASIC负责新增量的绝大部分」。

市场在扩大,ASIC在吃增量,GPU在守存量——这是未来3-5年最可能的行业格局。

对企业决策的影响

  • 短期(1-2年):继续用GPU,因为生态成熟、工程师熟悉、部署灵活
  • 中期(3-4年):核心推理工作负载评估ASIC路径,尤其是高频、低延迟需求
  • 长期(5年以上):超大规模推理基础设施,ASIC将成为主流选择

这不是革命,而是演化。但演化的终点,是AI计算格局的根本性重构。



第八章:对初创公司和投资者的具体影响

TrendForce的ASIC数据,对AI产业链上的不同角色有着差异化的含义:

对AI初创公司(推理层):如果你的业务是提供AI推理服务(如AI语音、AI图像、AI对话),你需要认真评估推理成本的优化路径。当主要竞争对手开始使用专用ASIC降低推理成本,坚持使用GPU可能在单位成本上输给竞争对手。目前最直接的路径是评估云端ASIC实例(Google TPU实例、AWS Trainium实例)对当前工作负载的适配性。

对AI平台公司(基础设施层):ASIC时代的赢家不只是芯片公司,还包括围绕ASIC生态系统的软件和工具链。支持TPU的ML框架(JAX)、用于ASIC任务调度的编排工具、针对自定义芯片架构的推理优化框架——这些都是在ASIC时代价值被重估的技术领域。

对半导体设计服务公司(EDA和IP授权):每一块定制ASIC都需要经过EDA(电子设计自动化)软件设计。Cadence和Synopsys是这个领域的主导者,它们的营收与ASIC出货量高度相关。ASIC繁荣,对这两家公司是直接利好。

对高带宽内存(HBM)供应商:ASIC和GPU一样,都需要大量HBM来解决内存带宽瓶颈。Micron和SK Hynix的HBM业务,将随着ASIC出货增速而同步增长。事实上,制约ASIC规模化的主要瓶颈之一,目前正是HBM的供货量——这是另一个整个AI计算产业链需要关注的供应链约束。

对Nvidia长期竞争力的重新评估

Nvidia的2026年股价和财务数据依然强劲。但一个值得关注的先行指标是:Nvidia在超大规模客户(Google、Amazon、Meta、Microsoft)中的GPU采购占比。如果这些大客户的自研ASIC份额持续上升,Nvidia来自这类客户的GPU营收可能在2027-2028年开始出现增速放缓,即使整体AI计算市场仍在增长。

这不是「Nvidia要崩盘」的叙事,而是「Nvidia的主要增长引擎将从超大规模客户转向主权AI、工业AI、Robotics等新场景」的结构性转变预期。总结来说,未来五年是AI算力格局最关键的重构窗口期,ASIC三倍增速是第一个可量化的历史信号。我们正在目睹的,是一场已经在数字里悄然发生的芯片权力转移。


参考资料: Outpace Nvidia GPU Growth, ASIC Shipments Set to Triple GPU Rate(来源:TechTimes,2026-05-26)https://www.techtimes.com/articles/317225/20260526/custom-ai-chips-outpace-nvidia-gpu-growth-2026-asic-shipments-set-triple-gpu-rate.htm

  1. AI Hyperscalers Expected to Spend $725 Billion, Semiconductor Index Hits Record High(来源:Yahoo Finance,2026-05-26)https://finance.yahoo.com/markets/stocks/articles/artificial-intelligence-ai-chip-stock-180218110.html
  2. Nvidia Delivers Vera AI CPUs to Leading AI Companies(来源:Yahoo Finance,2026-05-21)https://finance.yahoo.com/sectors/technology/articles/nvidia-delivers-vera-ai-cpus-113114593.html
  3. Nvidia CEO Jensen Huang: China AI Chip Market Largely Ceded to Huawei(来源:CNBC,2026-05-21)https://www.cnbc.com/2026/05/21/nvidia-jensen-huang-china-ai-chip-market-huawei.html