2026年3月的半导体行业出现了一个令人瞠目的景象:全球最大的芯片制造商台积电(TSMC)的最新一代 A16 制程节点的产能排期已经推至2028年以后,交货周期从正常的6周延长到了6个月,而客户们开始签订3到5年的长期供应协议来锁定产能。据 Reuters 和 Broadcom 高管的公开声明,就连 NVIDIA 这样年采购额数十亿美元的超级大客户,都无法获得足够的 A16 产能。Meta 也加入了先进制程的争夺战。

这不是通常意义上的”供应紧张”或”缺货”。这是全球半导体产能分配权的一次根本性重新洗牌。在 AI 时代,谁拿到了最先进的芯片制造产能,谁就拿到了通往 AI 未来的门票。

一、A16 是什么:为什么这个制程节点如此关键

要理解这场产能大战的严重性,首先需要理解 A16 制程在半导体技术路线图中的位置。

台积电的制程演进路线从目前量产中的3纳米推进到了2纳米(即将量产),而 A16(也被称为1.6纳米级别制程)是2纳米之后的下一代技术节点。A16 引入了几项关键的技术创新:背面供电网络(将电源线路从芯片正面移到背面,释放了正面的空间用于更密集的晶体管排列)、超级紧凑的纳米片(Gate-All-Around)晶体管结构、以及新的互连技术。这些创新的叠加效果是:相比前一代 N2 制程,A16 在相同功耗下性能提升约15%到20%,或在相同性能下功耗降低约25%到30%。

对于 AI 芯片来说,这些数字的含义是深远的。当前最先进的 AI 加速器——如 NVIDIA 的 B200 和 Google 的 TPU v6——已经触及了散热和功耗的物理极限。一个装满 B200 的服务器机架的功耗可以超过100千瓦,相当于约30个普通家庭的用电量。在数据中心层面,电力供应已经成为 AI 算力扩张的最大瓶颈之一(而非芯片供应本身)。A16 制程带来的25%到30%的功耗改善,意味着同样一个数据中心可以部署25%到30%更多的 AI 加速器——在算力就是竞争力的 AI 时代,这相当于凭空多出了四分之一的”石油”。

更关键的是,A16 是多个 AI 芯片巨头下一代产品的基础制程。NVIDIA 的下下代旗舰 GPU(代号 Rubin 的后续产品)、AMD 的 MI500 系列、Google 的下一代 TPU、以及 Amazon 的下一代 Trainium 芯片,据报道都在争抢 A16 产能。这意味着 A16 的产能分配将直接决定哪家公司能在2028年到2029年间推出最强的 AI 芯片——而在 AI 技术以月为单位快速迭代的行业中,比竞争对手晚6到12个月推出下一代产品可能就意味着失去整个市场周期。

二、供应侧的结构性瓶颈:不是”产能不足”这么简单

表面上看,A16 的产能紧张似乎是一个”供不应求”的简单故事——需求太大,台积电的产能不够用。但如果你深入分析供应侧的结构性因素,会发现问题要复杂得多。

第一个结构性瓶颈是先进封装产能。现代 AI 芯片不是一个单一的硅片,而是多个芯片通过先进封装技术(如 CoWoS——Chip on Wafer on Substrate)组合在一起的复杂系统。台积电的 CoWoS 封装产能在过去两年一直是 AI 芯片供应链中最紧张的环节之一——即使台积电可以制造出足够多的 A16 晶圆,如果 CoWoS 产能跟不上,最终的芯片产出仍然受限。

第二个结构性瓶颈是高带宽内存(HBM)的供应。AI 芯片需要大量的 HBM 来满足大语言模型的内存需求——一颗 B200 芯片需要搭配8颗 HBM3E 芯片,而 HBM 的生产周期长达12周以上。SK海力士和三星是全球仅有的两家 HBM 主要供应商,它们的产能同样严重不足。这意味着即使台积电突破了 A16 的良率和封装瓶颈,HBM 的供应不足仍然可能限制最终的 AI 芯片产出。

第三个结构性瓶颈是光刻设备。A16 制程需要 ASML 最新一代的高数值孔径极紫外光刻机(High-NA EUV),而这种设备的产量极为有限——ASML 的年产能据估计仅为约20到30台,每台售价超过3亿美元。台积电、三星和英特尔都在争抢这些设备,设备的交付进度直接决定了 A16 产线的建设速度。

Broadcom 的高管在公开声明中指出,短缺已经从芯片本身扩展到了激光器和印刷电路板(PCB)等辅助组件——这说明整个 AI 芯片供应链从上游到下游都处于紧张状态,瓶颈不是单一的而是系统性的。部分组件的交期从6周延长到了6个月,客户不得不签订3到5年的长期供应协议来确保未来的供应。

三、需求侧的爆炸:中国 AI 的140万亿 Token 引擎

如果供应侧的结构性瓶颈已经够让人头疼了,需求侧的爆炸性增长则让情况雪上加霜。

根据新浪科技和 Morgan Stanley 的数据,中国 AI 应用的日均 Token 消耗量已经突破了惊人的140万亿个,仅三个月就增长了超过40%,较2024年初增长了约1000倍。OpenRouter 的数据显示中国 AI 模型的周 Token 使用量达到7.359万亿,已经超过了美国的2.954万亿。Morgan Stanley 预测到2030年这个数字还将增长370倍。

这些数字意味着什么?每处理一个 Token 都需要消耗一定的芯片算力。当日均 Token 消耗量达到140万亿时,支撑这个消耗量所需要的 GPU 和 AI 加速器的数量是天文级别的。而且这个需求还在以每季度40%的速度增长——这意味着即使芯片供应量每年翻一番也无法满足需求。

与此同时,SEMICON China 2026——全球最重要的半导体贸易展之一——正在上海举行,1433家参展商的规模刷新了历史记录。参展商包括 ASML、Tokyo Electron 和大量中国本土半导体公司。展会的火爆程度本身就是需求过热的一个信号——当上千家公司都在争相进入半导体行业时,说明所有人都看到了同一个机会:AI 算力的需求缺口可能在未来5到10年内持续存在。

中国的 AI 芯片需求还有一个特殊的维度:美国的出口管制。由于美国对先进 AI 芯片(包括 NVIDIA A100、H100 及更新型号)的出口限制,中国企业无法直接购买最先进的美国 AI 芯片,被迫寻找替代方案。这创造了两个平行的需求通道:一个是直接需求(美国和其他未受限国家的企业抢购台积电产能来制造自家芯片),另一个是间接需求(中国企业通过自研芯片或替代架构来绕过制裁,但仍然需要先进制程来制造——只不过不一定是台积电的最先进制程)。

四、两条自研路径:DeepSeek 和阿里巴巴的突围

面对美国的出口管制,中国 AI 行业并没有坐以待毙。同一周内,两条截然不同的自研芯片路径同时浮出水面。

第一条路径是 DeepSeek 的”全自研”路线。据综合报道,DeepSeek 正在积极组建自己的半导体部门以制造定制 AI 芯片,正在招聘半导体设计专家。DeepSeek 目前依赖约10000块 NVIDIA H800、10000块 H100 以及华为昇腾芯片来支撑其 AI 模型的训练和推理。但这些芯片的供应都面临出口管制或供应短缺的风险——自研芯片是摆脱依赖的唯一出路。这条路径的挑战在于:芯片设计需要多年的人才和技术积累,而先进制造工艺的获取(即使不是台积电最先进的 A16)在当前的地缘政治环境下仍然困难重重。

第二条路径是阿里巴巴的”开放架构”路线。阿里巴巴发布了新一代 RISC-V 芯片 XuanTie C950——据 Reuters 报道,这是一款5纳米、3.2 GHz 的服务器处理器,被称为全球最高性能的 RISC-V CPU,性能比前代产品快3倍。阿里巴巴选择 RISC-V 而非 ARM 或 x86 架构,核心原因是 RISC-V 是一个完全开放的指令集架构——没有任何公司或国家可以通过授权限制来阻止你使用它。这使得 RISC-V 成为了在出口管制环境下最”安全”的架构选择。

这两条路径代表了截然不同的战略赌注。DeepSeek 的全自研路线赌的是自主可控——如果成功,DeepSeek 将拥有从模型到芯片的完整垂直整合能力,成为中国 AI 行业的”苹果”(苹果也是自研芯片加自研软件的垂直整合模式)。阿里巴巴的开放架构路线赌的是生态联盟——通过拥抱开放标准(RISC-V)来汇聚更广泛的产业力量,形成一个不依赖任何单一公司或国家的替代生态。

两条路径不是互斥的——事实上,它们可能在不同的时间尺度上互补。短期内(2到3年),RISC-V 开放生态可能更快见效,因为可以利用已有的开源资源和全球社区;长期内(5到10年),全自研的定制芯片可能提供更高的性能和能效比,因为可以为特定的 AI 工作负载进行深度优化。

五、Elon Musk 的搅局:250亿美元 Terafab 芯片工厂

在台积电产能争夺战的背景下,Elon Musk 在同一周宣布了一个更加大胆的计划:投资200到250亿美元在德州奥斯汀建设全球最大的半导体工厂——Terafab。这座工厂由 Tesla、SpaceX 和 xAI 联合投资,目标是2纳米工艺,计划月产100万片晶圆,生产 AI5 和 AI6 芯片(用于 AI 训练和推理)以及 D3 芯片(用于轨道卫星计算)。

Musk 的逻辑与 Bezos 的1000亿美元制造业计划有异曲同工之处——当现有供应商无法满足你的需求时,就自己造。但 Musk 的方案比 Bezos 更激进:Bezos 是收购现有工厂然后用 AI 改造,Musk 是从零开始建造一座全新的芯片工厂。

Terafab 的可行性存在巨大争议。建造一座先进制程的芯片工厂是世界上最复杂的工程项目之一——台积电花了超过30年时间才积累了足够的工艺能力来量产3纳米和2纳米制程,而英特尔试图追赶台积电的努力至今收效甚微。Musk 声称要在几年内建成一座2纳米工厂,这在技术上的挑战是巨大的。但考虑到 Musk 在 SpaceX 可回收火箭和 Tesla 超级工厂方面的实绩,完全否定他的能力也是不明智的。

无论 Terafab 最终能否建成,它的宣布本身就具有重要的市场信号意义:全球最大的 AI 消费者之一认为现有的半导体供应链无法满足其需求,并愿意投入250亿美元来建立自己的供应。这从侧面印证了台积电 A16 产能危机的严重程度。

六、大多数人没看到的:半导体产能分配正在成为地缘政治的核心议题

表面上看,A16 产能争夺是一场商业竞争。但它实际上正在演变成一个地缘政治议题。当芯片制造产能的分配直接决定了哪个国家能获得最强的 AI 能力时,产能分配就不再是一个纯粹的商业决策——它变成了一个关乎国家安全和战略竞争力的政治决策。

台积电已经在美国亚利桑那州建设先进制程工厂(受到美国政府数十亿美元补贴的激励),同时也在日本和德国规划新的生产基地。这些全球化的产能布局不仅是商业扩张,也是地缘政治博弈的结果——每一个工厂选址背后都涉及到政府补贴、技术转让承诺和供应优先权的复杂谈判。

Arm 在同一周发布了首款自研数据中心 CPU——拥有136个 Neoverse V3 核心的”AGI CPU”,与 Meta 合作开发,号称相比传统 x86 架构在每瓦性能上提升2倍以上,每千兆瓦数据中心可节省高达100亿美元的资本开支。OpenAI、Cerebras、Cloudflare、SAP 等50多家公司已表达支持。Arm 的这步棋瞄准的正是 AI 数据中心的能效瓶颈——当电力成为算力扩张的最大限制时,架构层面的能效优化就变得和芯片制程的进步一样重要。

对于企业和投资者来说,A16 产能危机的教训是:AI 的竞争不仅仅是模型和算法的竞争,更是基础设施——特别是半导体制造能力——的竞争。那些今天锁定了先进制程产能的公司,将在2028年到2029年间拥有不可复制的竞争优势;而那些现在才开始排队的公司,可能要等到2030年以后才能获得足够的产能。

在这场产能分配权的争夺中,没有观众席——每一个 AI 公司、每一个科技巨头、甚至每一个国家政府,都是场上的竞争者。而台积电,作为全球先进制程的唯一实质供应商,掌握着这场博弈中最关键的筹码。

So What:产能危机下的多维影响分析

对于 AI 创业公司来说,A16 产能危机意味着芯片供应将成为业务规划中不可忽视的约束条件。在过去,创业公司可以假设”只要有钱就能买到算力”——通过云服务商按需租用 GPU 即可。但当连 NVIDIA 都拿不到足够的台积电产能时,云服务商的 GPU 供应也将受到影响。创业公司需要提前至少12到18个月规划算力需求,并考虑锁定长期的云计算合同或探索替代架构。AWS 与 Cerebras 的合作正是这个趋势的体现——他们将 Trainium 芯片用于预填充阶段而 Cerebras CS-3 用于解码阶段,通过异构计算来缓解单一芯片供应的瓶颈。这种”混合推理架构”可能成为未来几年的行业常态。

对于投资者来说,半导体供应链的每一个瓶颈环节都蕴含着投资机会。先进封装技术(特别是 CoWoS 和相关的基板材料)、高带宽内存(HBM 产能扩张)、以及 RISC-V 生态(作为替代架构的长期赌注)都是值得关注的投资方向。但需要警惕的是,半导体行业具有强烈的周期性——当下的极度紧缺可能在三到四年后因为产能过度扩张而转变为供过于求。关键在于判断这次的需求增长是 AI 驱动的结构性增长(持续十年以上),还是投资过热导致的周期性泡沫(三到五年后破裂)。根据目前的证据——中国日均140万亿 Token 的消耗量、全球 AI 模型参数量每年翻倍的趋势、以及企业级 AI Agent 部署的加速——结构性增长的判断更为可信,但周期性波动仍然不可避免。

对于企业技术决策者来说,最重要的行动是多元化算力供应源。不要把所有赌注押在单一芯片架构或单一云服务商上。评估 NVIDIA GPU、AMD MI 系列、Google TPU、AWS Trainium、以及新兴的异构计算方案在你的具体工作负载上的性能表现,建立多供应商策略以对冲供应链风险。同时密切关注 RISC-V 生态的成熟度——阿里巴巴 XuanTie C950 的性能数据表明,RISC-V 在服务器领域已经达到了实用门槛,虽然在 AI 加速方面还不能与 NVIDIA GPU 直接竞争,但作为通用计算和推理工作负载的补充选择已经具备了可行性。

更宏观地看,这场半导体产能大战揭示了 AI 时代一个残酷的现实:技术优势最终将受制于物理世界的约束。无论你的 AI 算法有多先进、你的模型架构有多创新,如果你拿不到足够的芯片来训练和部署这些模型,一切都是空谈。在这个意义上,半导体制造能力正在取代软件创新能力,成为 AI 竞争中最核心的战略资源。谁控制了芯片产能,谁就控制了 AI 的未来——这是台积电 A16 产能危机给我们上的最重要的一课。而这堂课的影响范围远不止 AI 行业本身——从智能手机到电动汽车,从5G 基站到军事通信设备,所有依赖先进制程芯片的行业都将感受到这场产能危机的连锁冲击。在全球化退潮和技术民族主义抬头的大背景下,半导体供应链的每一个环节都变成了地缘政治的博弈筹码,而处于这个博弈中心的台积电,承受着前所未有的战略压力和历史责任。未来的赢家不一定是拥有最好算法的人,而是那些在芯片产能、能源供应和数据资源三重约束下找到最优解的人。这就是为什么这场产能大战不仅仅是一场商业竞争,更是一场关于谁能定义 AI 时代基础规则的战略较量。

参考资料

  1. Broadcom Says TSMC Capacity Is Bottleneck for AI Chips — Reuters, 2026-03-24
  2. TSMC A16 产能争夺 — 综合报道, 2026-03-25
  3. 中国日均 AI Token 突破140万亿 — 新浪科技/Morgan Stanley, 2026-03-25
  4. Alibaba RISC-V Chip XuanTie C950 — Reuters, 2026-03-24
  5. Elon Musk’s Terafab Chip Factory — CNET, 2026-03-24
  6. SEMICON China 2026 — SEMI, 2026-03-25
  7. Arm Launches First Self-Designed Data Center CPU — 新浪科技, 2026-03-25