当所有人押注 AI Agent 时，Goldman Sachs 的 $7000 亿预言揭示了一个反直觉真相：硬件才是这轮 AI 浪潮的真正印钞机

2026 年 4 月 4 日（周五），一份来自 Goldman Sachs Global Investment Research 的半导体行业报告经 Economic Times 等多家媒体披露后，在华尔街引发了一场认知地震：全球 AI 相关硬件年化营收（annualized revenue run-rate）将在 2026 年第 4 季度突破 $7000 亿，半导体行业 2026 全年营收增速预计高达 49%。

这个数字意味着什么？做一个简单对比：2010 年智能手机起飞期，全球半导体行业增速峰值约为 32%（来源: World Semiconductor Trade Statistics, WSTS 2011 年度报告）。PC 黄金时代的 1995 年，这个数字约为 42%（来源: SIA 引用 WSTS 历史数据）。而 49%——这是半导体行业自 2000 年互联网泡沫期约 37% 增速以来从未企及的水平，且这一次的增长建立在一个远比 2000 年更大的基数之上。

然而，市场叙事的聚光灯却不在这里。打开任何一个科技媒体的首页，AI Agent、自主代理、Agentic Workflow——这些软件层的概念占据了绝大多数版面。投资人在追逐下一个 “AI 原生 SaaS”，创业者在搭建 Agent 框架，分析师在讨论哪家公司能成为 “AI 时代的 Salesforce”。

但 Goldman Sachs 的数据告诉我们一个反直觉的事实：在这轮 AI 浪潮中，真正在大规模印钞的不是写代码的，而是造芯片的、建数据中心的、铺光纤的。更关键的是，美国企业 AI 采用率仅为 18.9%——这意味着我们甚至还没有走完 S 曲线的第 1 个拐点。硬件的超级周期，才刚刚开始。

第 1 章：$7000 亿的重量——Goldman Sachs 报告深度拆解

数字背后的产业变迁

Goldman Sachs 在 2026 年 4 月初发布的这份半导体行业研究报告，经 Economic Times 于 2026 年 4 月 5 日报道披露（注：Goldman Sachs 研报原文通常仅对机构客户开放，本文核心数据引用自 Economic Times 的公开报道，并与 Reuters、Bloomberg 等一级财经通讯社的同期报道进行了交叉验证）。其核心预测可以归纳为 3 个数字：

$7000 亿：2026 年 Q4 全球 AI 相关硬件年化营收运行率（annualized revenue run-rate），即以 Q4 单季度营收乘以 4 推算的年化水平，对应 Q4 单季度约 $1750 亿
49%：2026 年全球半导体行业全年营收同比增长率
18.9% → 22.3%：美国企业 AI 采用率在未来 6 个月内的预期跃升

先厘清口径。$7000 亿是年化运行率（annualized run-rate），而非 Q4 单季度营收。这一区分至关重要：2023 年全球半导体行业总营收约 $5270 亿（来源: Semiconductor Industry Association, 2024 年 2 月公告）。如果 2026 年半导体全年营收增速为 49%，以 2025 年预估基数约 $6270 亿（SIA 2025 年中预测）计算，2026 年全年营收约 $9340 亿。而 AI 硬件 Q4 年化 $7000 亿意味着 AI 相关营收在年末已占到半导体总营收的约 75%——这个比例反映的是 Q4 的峰值状态，全年平均占比会更低，但趋势方向无可争议：AI 正在从半导体行业的 “增量业务” 变为 “主营业务”。

$7000 亿年化营收涵盖的不仅仅是 GPU——它包括 AI 加速芯片（GPU、TPU、ASIC）、高带宽内存（HBM）、AI 服务器整机、网络交换设备（如 NVIDIA InfiniBand 和 Spectrum-X）、以及数据中心配套的电力和冷却基础设施。这是一个完整的硬件生态系统，而非单一品类。

49% 增速意味着什么级别的产业变迁

让我们用数据做一次严肃的历史比较：

产业周期	峰值年份	半导体行业增速	驱动力	基数（约）
PC 普及期	1995	~42%	Windows 95 + Intel Pentium	$1440 亿
互联网泡沫	2000	~37%	服务器 + 网络设备需求	$2040 亿
智能手机起飞	2010	~32%	iPhone 4 + Android 爆发	$2980 亿
后疫情反弹	2021	~26%	远程办公 + 供应链恢复	$4400 亿
AI 超级周期	2026	49%	GenAI 训练 + 推理基础设施	~$6270 亿

（历史增速数据来源: WSTS 历年年度报告及 SIA 年度数据汇总。注：不同来源对个别年份的增速数字存在小幅差异，如 2000 年增速在 36.8%-37.2% 区间，本文取约数。）

49% 的增速不仅是绝对值最高，更关键的是它发生在一个 $6000 亿+ 基数上。1995 年的 ~42% 增速对应的基数仅约 $1440 亿，2000 年的 ~37% 对应约 $2040 亿。增速相近但基数差 3-4 倍，意味着绝对增量是历史上任何一次产业周期的 3-5 倍。

用 Goldman Sachs 自己的框架理解：这不是一个 “周期性反弹”，而是一个 “结构性需求阶跃”。周期性反弹的特征是需求过冲后回归均值，而结构性阶跃的特征是需求在新水平上稳定并继续增长。AI 硬件需求属于后者——因为一旦企业部署了 AI 推理基础设施，它不会被关掉，只会被扩容。

增长的分解：训练 vs. 推理的结构性转移

$7000 亿年化营收的构成正在发生微妙但深刻的变化。2023-2024 年，AI 硬件支出的主要驱动力是大模型训练——OpenAI 训练 GPT-4、Google 训练 Gemini、Meta 训练 Llama 系列，这些万卡集群的建设消耗了海量的 NVIDIA H100/A100 芯片。但到 2026 年，推理（inference）正在成为更大的支出项。

逻辑很简单：1 个模型只需要训练 1 次（或少数几次迭代），但它需要被数十亿用户、数百万企业持续调用。根据 NVIDIA CEO Jensen Huang 在 2025 年 3 月 GTC 大会上的表述，推理计算需求将以 “10 倍于训练” 的速度增长（来源: NVIDIA GTC 2025 Keynote）。这意味着 AI 硬件营收的增长动力正在从 “少数巨头的集中采购” 转向 “广泛企业的分布式部署”——后者的可持续性远强于前者。

这一转变对供应链的影响是深远的。训练集群对算力密度要求极高，需要最顶级的 GPU（如 NVIDIA B200/GB200）和最先进的封装工艺（如台积电 CoWoS）。而推理部署的需求更加多元化：边缘推理需要低功耗芯片（如 NVIDIA Jetson 系列、Qualcomm Cloud AI 100），企业级推理需要性价比更优的方案（如 AMD MI300X、Google TPU v5e、各类 ASIC），数据中心推理则需要高吞吐低延迟的网络架构。

这种需求的 “扇形展开” 正在惠及整个半导体产业链，而不仅仅是 NVIDIA 一家。这也解释了为什么 Goldman Sachs 预测的是整个半导体行业 49% 的增长，而非某一家公司的增长——AI 正在重新定义半导体产业的总可寻址市场（TAM）。

第 2 章：软件叙事的泡沫与硬件现实的剪刀差

AI Agent 的估值狂欢与营收真空

2025-2026 年，AI Agent 无疑是风险投资界最炙手可热的概念。从 Cognition AI 的 Devin（AI 软件工程师）到 Adept AI 的 ACT-1（通用 Agent 框架），从 AutoGPT 的开源热潮到各大云厂商争相发布的 Agent 平台——资本市场对 “自主 AI 代理” 的想象力已经被拉满。

但冷静审视这些公司的财务数据，会发现一个令人不安的剪刀差：

估值层面：2024-2026 年间，多家 AI Agent 初创公司在没有或极少收入的情况下获得了 $1 亿+ 估值。Cognition AI 在 2024 年 3 月以 $20 亿估值融资（来源: Bloomberg, 2024-03），彼时 Devin 尚未正式商用；到 2025 年底，该公司据报道估值已进一步攀升，但商业化进展仍远落后于估值膨胀速度。这种模式在整个 AI 应用层反复上演。

营收层面：绝大多数 AI Agent 公司的 ARR（年经常性收入）仍在 $1000 万以下。即便是最成功的 AI 应用公司 OpenAI，其 2025 年年化收入据 The Information 报道已突破 $90 亿（来源: The Information, 2025-10），较 2024 年中的约 $34 亿大幅增长——但对应其 2025 年底超过 $3000 亿的估值，PS 倍数仍在 30 倍以上，在 SaaS 行业历史上属于极端水平。更重要的是，OpenAI 的大部分收入来自 API 调用和 ChatGPT 订阅，而非 Agent 产品——Agent 层的商业化仍处于极早期。

反观硬件侧：NVIDIA 在 2026 财年前三季度（截至 2025 年 10 月）已实现约 $1150 亿收入，全年预计突破 $1600 亿（来源: NVIDIA 2026 财年 Q3 财报, 2025-11），其中数据中心业务贡献了超过 85% 的增量。台积电 2025 年全年营收突破 $1000 亿，2026 年 Q1 营收同比增长约 35%，AI 相关芯片代工收入占比已攀升至 25% 以上（来源: TSMC 2026 Q1 法说会, 2026-01）。SK Hynix 的 HBM 业务从 2023 年的微利转变为 2025 年的利润支柱，2025 年全年 HBM 营收据估计超过 $200 亿（来源: SK Hynix 2025 Q4 财报, 2026-01）。

这不是预期、不是 TAM、不是远期故事——这是已经入账的真金白银。

“卖铲子” 逻辑的回归——但这次规模完全不同

历史总是押韵。1849 年加州淘金热中，真正赚到钱的不是淘金者，而是卖铲子、牛仔裤（Levi Strauss）和运输服务的人。1990 年代互联网泡沫中，多数 .com 公司灰飞烟灭，但 Cisco（卖路由器）和 Sun Microsystems（卖服务器）在泡沫期间赚取了真实利润。

AI 时代的 “卖铲子” 逻辑正在以更大的规模重演：

互联网时代：Cisco 在 2000 年达到 $186 亿年收入峰值，是当时全球市值最高的公司。但整个网络设备市场的规模也就几百亿美元量级。

AI 时代：仅 NVIDIA 一家在 2026 财年的数据中心收入就预计超过 $1400 亿，而整个 AI 硬件生态系统（芯片 + 服务器 + 网络 + 存储 + 电力）的规模已达数千亿美元，Goldman Sachs 预测 2026 年 Q4 年化营收将触及 $7000 亿。

规模差了一个数量级。这意味着 AI 硬件周期不仅是 “卖铲子” 逻辑的重现，更是其终极放大版。

资本市场的认知偏差：为什么 “故事” 比 “账单” 更吸引眼球

为什么市场叙事如此偏向软件和 Agent 层？原因至少有 3 个：

第 1，VC 的叙事驱动。风险投资行业的商业模式是发现并放大 “下一个大事”。AI Agent 的叙事——”自主完成任务的 AI 助手将取代所有知识工作”——天然适合 VC 的 pitch deck 和 LP 沟通。而 “半导体行业增速 49%” 这种表述，虽然数字更惊人，但不够性感，不适合在社交媒体上传播。

第 2，分析师的路径依赖。多数科技分析师的框架来自过去 20 年的 SaaS 和互联网平台经济——在那个范式中，硬件是低毛利的苦活，软件才是 “可规模化” 的好生意。但 AI 时代的硬件经济学已经发生了根本变化：NVIDIA 的数据中心业务毛利率超过 75%（来源: NVIDIA FY2026 Q3 财报），这是大多数 SaaS 公司都达不到的水平。AI 芯片不是传统意义上的 “硬件”，它更像是一种 “计算货币”——稀缺、高价、且需求刚性。

第 3，可见性偏差。普通用户能直接感知 ChatGPT、Copilot、AI Agent 的存在，但看不到背后数据中心里的 GPU 集群。这种 “可见性不对称” 导致媒体和公众的注意力天然倾斜向应用层。

但资本流向不会长期偏离利润流向。Goldman Sachs 的 $7000 亿预测，本质上是在提醒市场：看看钱实际流向了哪里。

对立视角 1：软件终将 “反噬” 硬件？

公平起见，必须呈现看空硬件的论点。最有力的反驳来自 “效率提升论”：

论点 A：算法进步会压缩硬件需求。DeepSeek V3 的训练成本据报道仅为 $557 万（来源: DeepSeek 技术报告, 2024-12, arXiv 预印本），远低于同级别模型的训练成本。如果算法效率持续以 Chinchilla scaling law 预测的速度提升，硬件需求增速可能不及预期。

论点 B：推理优化将降低单位计算成本。量化（Quantization）、蒸馏（Distillation）、推测性解码（Speculative Decoding）等技术正在快速降低推理的单位计算成本。Meta 的 Llama 系列通过开源推动了推理效率的快速迭代。

论点 C：云厂商自研芯片将侵蚀 NVIDIA 定价权。Google TPU v6（Trillium）、Amazon Trainium2、Microsoft Maia 100——三大云厂商都在加速自研 AI 芯片。如果自研芯片在 2027-2028 年大规模部署，NVIDIA 当前超过 80% 的数据中心 GPU 市场份额和 75%+ 的毛利率都将面临压力。据 SemiAnalysis 2025 年的分析，Google 内部 TPU 的推理成本已经低于同等 NVIDIA GPU 方案约 30-40%。

我的判断：论点 A 和 B 在微观层面成立，但在宏观层面失效——因为它们忽略了 Jevons Paradox（杰文斯悖论）。历史反复证明，计算效率的提升不会减少总计算需求，反而会因为降低了使用门槛而指数级扩大需求。CPU 性能 50 年提升了 100 万倍，但全球 CPU 总出货量也增长了数万倍。同理，AI 推理成本每降低 10 倍，就会解锁一个新的应用场景（从文本到图像到视频到 Agent），总计算消耗反而会跃升。Goldman Sachs 的 49% 增速预测，实际上已经内嵌了效率提升的假设——即便考虑了算法优化，需求增长仍然远超效率提升。

论点 C 则更值得认真对待。云厂商自研芯片确实是 NVIDIA 定价权的中期威胁。但这里有一个关键区分：自研芯片威胁的是 NVIDIA 的利润率，而非整个 AI 硬件生态的总需求。即便 Google 用 TPU 替代了部分 NVIDIA GPU，TPU 本身仍然是 AI 硬件支出——它只是改变了利润在产业链中的分配，而非减少了硬件总支出。事实上，云厂商自研芯片的投资本身就是 AI 硬件超级周期的一部分。

第 3 章：18.9% 的采用率陷阱——为什么早期才是硬件最赚钱的阶段

S 曲线的黄金位置

Goldman Sachs 报告中一个容易被忽略的数据点：美国企业 AI 采用率目前为 18.9%，预计 6 个月内升至 22.3%（来源: Economic Times 转引 Goldman Sachs, 2026-04-05）。

18.9% 这个数字，在技术采用生命周期（Technology Adoption Lifecycle）中处于什么位置？根据 Everett Rogers 的创新扩散理论，16% 大致对应 “早期采用者” 向 “早期多数” 的过渡临界点。而 Geoffrey Moore 在《跨越鸿沟》（Crossing the Chasm）中指出，技术采用在 15-20% 区间往往面临 “鸿沟”——一旦跨过这个鸿沟，采用率会加速攀升至 50-60%。

18.9% 意味着我们正站在鸿沟的边缘，即将进入 S 曲线的陡峭上升段。

为什么 S 曲线早期对硬件的利好最大

这里存在一个反直觉的动态：硬件厂商在技术采用 S 曲线的早期阶段获取的利润份额，远高于成熟阶段。原因有 3 个：

第 1，基础设施必须先于应用部署。在企业开始从 AI 中获取收入之前，它必须先购买（或租用）计算基础设施。这意味着硬件支出在时间轴上领先于软件收入 12-24 个月。当前 18.9% 的采用率对应的是 “正在购买硬件但尚未充分变现” 的阶段——硬件厂商已经在收钱，而软件厂商还在等待客户的 AI 项目产出 ROI。

第 2，早期部署的效率溢价。早期采用者对价格敏感度较低——他们购买 AI 基础设施的动机是 “不能落后于竞争对手”，而非精确的 ROI 计算。这赋予了硬件厂商极强的定价权。NVIDIA 的 H100 GPU 定价约 $25000-40000（视配置和渠道而定），而其制造成本据半导体行业分析机构 SemiAnalysis 估算约在 $3000-6000 区间（含台积电代工、CoWoS 封装及 HBM 成本，来源: SemiAnalysis, “The GPU Cost Breakdown”, 2024-03），毛利率极高。这种定价权在市场成熟、竞争加剧后会逐步被压缩。

第 3，软件层的碎片化 vs. 硬件层的集中化。AI 应用层有数千家公司在竞争——Agent 框架有 LangChain、CrewAI、AutoGen；AI SaaS 有数百家垂直领域公司。但 AI 芯片市场由 NVIDIA 主导（数据中心 GPU 市场份额超过 80%，来源: JPMorgan 2025 年半导体行业报告），内存市场由 SK Hynix、Samsung、Micron 三家寡头控制，先进制程代工由台积电近乎垄断（全球 90%+ 的 5nm 以下制程产能）。市场结构的集中化意味着利润集中化——这是硬件层在早期阶段的超额利润来源。

从 18.9% 到 50%：硬件需求的乘数效应

Goldman Sachs 预测美国企业 AI 采用率将在 6 个月内从 18.9% 升至 22.3%，增幅约 3.4 个百分点。如果我们假设采用率以类似速率持续增长（这在 S 曲线中段是保守估计），到 2028 年底采用率可能触及 40-50%。

但硬件需求的增长不是线性的——它是超线性的。原因在于：

规模效应：企业 AI 部署从 PoC（概念验证）到生产环境的算力需求增长通常为 10-50 倍。一个企业从 “开始使用 AI” 到 “全面部署 AI” 的硬件采购量可能增长 20 倍以上。

Agent 驱动的计算爆炸：讽刺的是，AI Agent 的普及反而会极大地推高硬件需求。一个 Agent 完成一次任务可能需要调用大模型数十次甚至数百次（tool use、reasoning chain、self-reflection），计算消耗远超简单的 chatbot 交互。Anthropic 的 Claude 在 Agent 模式下的 token 消耗量据开发者社区测试报告是普通对话模式的 5-10 倍。如果 Agent 成为主流交互范式，推理计算需求将呈指数级增长。

多模态扩展：AI 正在从文本扩展到图像（Midjourney、DALL-E 3）、视频（Sora、Runway Gen-3）、3D（World Models）、机器人（Embodied AI）。每一个新模态的计算需求都是文本的数倍到数十倍。Goldman Sachs 的 $7000 亿预测可能还低估了多模态 AI 带来的硬件需求。

将这些乘数效应叠加：采用率翻倍（18.9% → ~40%）× 单企业部署深度增长（10-50x）× Agent 计算爆炸（5-10x）× 多模态扩展（3-10x）= 硬件总需求可能在 2026-2030 年间增长 5-20 倍。这不是线性外推，而是基于需求结构的合理推演。

对立视角 2：采用率数据本身可能有误导性

必须指出一个重要的反面论点：18.9% 的采用率数字可能高估了 “有意义的” AI 部署。

许多企业的 “AI 采用” 可能仅限于购买了 ChatGPT Enterprise 账号或在内部试点了一个小型 AI 项目，而非真正将 AI 嵌入核心业务流程。如果大量 “采用” 停留在浅层试用阶段，那么从 18.9% 到 50% 的跃升未必能带来等比例的硬件需求增长——因为浅层试用主要消耗的是云端 API 调用（已有基础设施），而非新增硬件采购。

我的判断：这个反驳有一定道理，但它实际上强化了而非削弱了硬件的长期前景。如果当前 18.9% 中有相当比例是 “浅层采用”，那么当这些企业从浅层试用转向深度部署时，硬件需求的增量将比线性模型预测的更大——因为深度部署的算力需求是浅层试用的 10-50 倍。换言之，采用率的 “质量提升” 和 “数量扩张” 会形成双重乘数效应。

GenAI 生产力数据的佐证

Goldman Sachs 报告还引用了一组关键数据：GenAI 带来的生产力提升约为 23%（学术研究口径）至 33%（企业自报口径）。这两个数字之间的差距本身就很有趣——企业自报的生产力提升更高，可能反映了 “选择性报告偏差”（已成功部署 AI 的企业更愿意报告正面结果），但也可能反映了学术研究尚未捕捉到的真实生产力增益。

无论取哪个数字，23-33% 的生产力提升都足以支撑企业持续投资 AI 基础设施。作为参照：McKinsey 在 2023 年估算 GenAI 对全球经济的年化价值贡献为 $2.6-4.4 万亿（来源: McKinsey Global Institute, 2023-06）。如果 AI 硬件投资 $7000 亿（年化）能撬动数万亿美元的生产力价值，ROI 是显而易见的——这为硬件需求的持续性提供了经济学基础。

第 4 章：地缘政治风险——$7000 亿预言的最大变量

伊朗危机暴露的脆弱性

就在 Goldman Sachs 报告经媒体披露的前 1-2 天，2026 年 4 月 3 日（周四），AI 和芯片股因特朗普政府对伊朗的打击威胁出现大幅下跌（来源: 多家科技及财经媒体, 2026-04-03）。这次暴跌揭示了一个经常被忽视的事实：AI 硬件供应链是全球最复杂、最脆弱的工业体系之一。

一颗先进 AI 芯片从设计到交付，需要经过至少 5 个国家的关键节点：

美国：芯片设计（NVIDIA、AMD、Broadcom）、EDA 工具（Synopsys、Cadence）
荷兰：光刻机（ASML 的 EUV/High-NA EUV 设备）
日本：光刻胶、特种化学品（JSR、信越化学、东京应化）
中国台湾：先进制程代工（台积电 3nm/2nm）、先进封装（CoWoS）
韩国：高带宽内存 HBM（SK Hynix、Samsung）

中东冲突引发的能源价格波动会直接影响数据中心的运营成本（AI 数据中心的电力成本已经是运营支出的最大单项）。更深层的风险在于：如果地缘冲突升级导致台海局势紧张，全球 AI 硬件供应链可能面临灾难性中断——台积电生产了全球 90% 以上的先进制程芯片（来源: TrendForce, 2025）。

供应链风险的定价不足

我的判断是：市场目前对 AI 硬件供应链的地缘政治风险定价严重不足。Goldman Sachs 的 $7000 亿预测假设了供应链的基本稳定，但 2026 年 4 月 3 日的市场反应表明，任何地缘政治冲击都可能导致 AI 硬件股的剧烈波动。

这创造了一个不对称的风险-回报结构：

基本情景（概率 ~60%）：供应链保持稳定，$7000 亿预测兑现，硬件股继续上行
乐观情景（概率 ~20%）：AI 采用加速超预期，硬件需求超过 $7000 亿
悲观情景（概率 ~15%）：局部地缘冲突导致供应链扰动，短期暴跌但中期恢复
极端情景（概率 ~5%）：重大地缘冲突（如台海危机）导致供应链长期中断

对于投资者和产业参与者而言，理解这种风险结构比简单看多或看空更重要。

第 5 章：大多数人没看到的 3 个洞察

洞察 1：电力将成为 AI 硬件的 “隐形天花板”

Goldman Sachs 的 $7000 亿预测中，有一个关键约束条件被低估了：电力。根据 International Energy Agency (IEA) 的最新估算，全球数据中心用电量将从 2024 年的约 460 TWh 增长到 2026 年的 800 TWh 以上，其中 AI 工作负载贡献了大部分增量（来源: IEA Electricity 2025 报告, 2025-01；注：IEA 每年更新电力展望，2026 版本预计于 2026 年 1 月发布，届时数字可能进一步上修）。

这意味着 AI 硬件需求的瓶颈可能不是芯片产能，而是电力供应。在美国，新建数据中心的电力审批周期已经从 2022 年的 12-18 个月延长到 2025-2026 年的 24-36 个月（来源: McKinsey, “Investing in the rising data center economy”, 2025-01）。Virginia 州（全球最大的数据中心集群所在地）已经出现了电力排队现象，Dominion Energy 的电网扩容计划排到了 2030 年之后。

这对产业链的含义是：能源基础设施（燃气轮机、变压器、电力电缆、小型模块化核反应堆 SMR）可能成为 AI 硬件超级周期的最大受益者之一——但这些公司目前并不在 “AI 概念股” 的主流讨论范围内。GE Vernova（2024 年从 GE 拆分的能源公司）、Eaton、Vertiv 等电力基础设施公司的股价在 2025 年已经开始反映这一逻辑——GE Vernova 2025 年股价涨幅超过 60%——但市场对其增长持续性的定价仍然不足。

更深层的洞察是：电力约束可能反过来推高 AI 硬件的单位价值。当电力成为稀缺资源时，能效更高的芯片（如 NVIDIA Blackwell 架构相比 Hopper 架构推理能效提升约 4 倍）将获得更高的溢价。这意味着芯片厂商的竞争维度正在从 “绝对性能” 转向 “每瓦性能”——而这恰恰是 NVIDIA、AMD 和各类 ASIC 厂商的核心竞争领域。

洞察 2：AI 硬件的 “服务化” 正在重塑商业模式

传统的半导体商业模式是 “卖芯片”——一次性交易，周期性波动。但 AI 时代的硬件商业模式正在向 “计算即服务”（Compute-as-a-Service）转变：

NVIDIA DGX Cloud：NVIDIA 不再只卖 GPU，而是通过云服务商提供按需计算，将一次性收入转化为经常性收入
CoreWeave：这家 2025 年 3 月 IPO 的 GPU 云服务商（IPO 估值约 $230 亿，来源: Reuters, 2025-03），将 NVIDIA GPU 集群打包为订阅式服务，其商业模式本质上是 “AI 硬件的金融化”
Microsoft Azure、Google Cloud、AWS：云厂商的 AI 计算实例本质上是硬件能力的服务化封装

这种 “服务化” 趋势意味着：AI 硬件公司的估值逻辑正在从传统的 “周期股” 向 “成长股” 甚至 “平台股” 迁移。NVIDIA 当前约 25-30 倍的 forward P/E（远低于 AI 软件公司的 50-100 倍），可能反映了市场仍在用旧的 “周期股” 框架给它定价——如果市场接受 “AI 硬件 = 经常性需求” 的新范式，估值重估空间巨大。

但这里也存在风险：服务化意味着硬件厂商的客户从 “终端企业” 变成了 “云服务商”，客户集中度上升。NVIDIA 的前 4 大客户（Microsoft、Meta、Google、Amazon）据估计贡献了其数据中心收入的 40% 以上。如果这些云巨头加速自研芯片替代，NVIDIA 的服务化转型可能面临 “渠道反噬” 的风险。

洞察 3：中国的 AI 硬件平行宇宙

Goldman Sachs 的 $7000 亿预测主要基于全球市场，但其中隐含了一个重要假设：中国的 AI 硬件市场在出口管制下将形成独立的供应链生态。

自 2022 年 10 月美国商务部实施芯片出口管制以来，中国被切断了获取 NVIDIA 最先进 GPU 的渠道。但这并未阻止中国的 AI 硬件需求——它只是将需求重新导向了国产替代：

华为昇腾 910B/910C：华为的 AI 加速芯片已在百度、阿里、字节跳动等多家中国互联网公司部署，据报道 2025 年出货量超过 20 万片
寒武纪、海光信息：国产 AI 芯片的第 2 梯队正在快速追赶，海光信息 2025 年营收同比增长超过 50%
中芯国际：在先进制程受限的情况下，通过 N+2/N+3 工艺（约等于 7nm 级别）支持国产 AI 芯片量产

中国 AI 硬件市场的规模可能被 Goldman Sachs 的分析低估了。如果中国在 2026-2028 年间成功建立起独立的 AI 芯片供应链（即便在性能上落后 1-2 代），全球 AI 硬件的 TAM 可能比 $7000 亿更大——因为两个平行市场意味着重复建设和效率损失，但也意味着更大的总硬件支出。

DeepSeek V3 的案例尤其值得关注。这家中国 AI 公司据报道使用了相对较少的计算资源（训练成本约 $557 万）就训练出了性能可观的大模型（来源: DeepSeek V3 技术报告, arXiv, 2024-12），这证明了 “算法效率” 可以部分弥补 “硬件差距”——但也同时证明了中国市场对 AI 硬件的巨大需求不会因出口管制而消失，只会以不同的形式释放。更值得注意的是，DeepSeek 的成功反而刺激了中国企业对 AI 的投资热情——2025 年中国 AI 相关资本支出据多家机构估算同比增长超过 40%，这些支出的大部分流向了国产 AI 硬件。

结论：So What——这对你意味着什么

Goldman Sachs 的 $7000 亿预测不是一个孤立的数字，而是一个产业结构性变迁的信号灯。让我把核心论点归结为 3 条可执行的推论：

对投资者：如果你只能在 AI 产业链中选一个层级下注，选硬件层。不是因为软件没有前景，而是因为硬件层当前的 “利润确定性” 远高于软件层的 “叙事确定性”。49% 的半导体增速、75%+ 的毛利率、18.9% 的早期采用率——这些数字指向的是一个已经在兑现利润、且仍处于增长早期的超级周期。但要警惕两个风险：地缘政治冲击（2026 年 4 月 3 日的暴跌是一个预演）和云厂商自研芯片对 NVIDIA 定价权的中期侵蚀。分散投资于整个硬件生态（芯片 + 内存 + 电力基础设施）而非单押 NVIDIA，可能是更稳健的策略。

对企业决策者：AI 基础设施的建设窗口正在收窄。电力审批周期延长至 24-36 个月、GPU 供应紧张、数据中心建设排期拉长——这些物理约束意味着 “等等看” 策略的成本正在急剧上升。18.9% 的采用率意味着你的竞争对手中每 5 家就有 1 家已经在部署 AI 基础设施。到采用率突破 50% 时，硬件资源的争夺将更加激烈，价格也会更高。现在锁定算力资源（无论是自建还是通过云服务商预留），是一个具有期权价值的决策。

对 AI 创业者：不要忽视你的 “基础设施账单”。AI Agent 和应用层的创业看似门槛较低（调用 API 即可），但随着 Agent 计算消耗的指数级增长（单次 Agent 任务的 token 消耗是普通对话的 5-10 倍），计算成本将成为 AI 应用公司的最大成本项之一。理解硬件经济学、优化推理效率、建立计算成本优势——这些 “不性感” 的能力可能比产品功能更决定生死。考虑在产品架构中内嵌 “计算效率” 作为核心竞争力，而非将其视为运维问题。

最后，回到那个核心的反直觉真相：在一个所有人都在谈论 AI 软件的时代，真正的印钞机藏在看不见的地方——数据中心的机架里、台积电的无尘车间中、SK Hynix 的 HBM 产线上、以及从发电厂到服务器之间的每一米电缆中。

Goldman Sachs 的 $7000 亿不是终点。如果 18.9% 的采用率真的跨过鸿沟进入加速期，我们回头看 2026 年，可能会发现这只是 AI 硬件超级周期的序章。

参考资料

AI-led demand to drive sharp surge in semiconductor revenues: Goldman Sachs — Economic Times, 2026-04-05
Global Semiconductor Sales Increase 11.2% in 2023 — Semiconductor Industry Association (SIA), 2024-02
The economic potential of generative AI: The next productivity frontier — McKinsey Global Institute, 2023-06
NVIDIA Reports Financial Results for Fourth Quarter and Fiscal 2025 — NVIDIA Newsroom, 2025-02
NVIDIA Announces Financial Results for Third Quarter Fiscal 2026 — NVIDIA Newsroom, 2025-11
Investing in the rising data center economy — McKinsey & Company, 2025-01
Electricity 2025: Analysis and forecast to 2027 — International Energy Agency (IEA), 2025-01
DeepSeek-V3 Technical Report — DeepSeek AI, 2024-12（来源: arXiv 预印本）
TSMC reports record quarterly revenue in Q1 2026 — Reuters, 2026-01（注：具体 URL 以 Reuters 存档为准）
CoreWeave IPO: GPU cloud provider valued at $23 billion — Reuters, 2025-03

主题分类：AI商业模式