当所有人押注 AI Agent 时,Goldman Sachs 的 $7000 亿预言揭示了一个反直觉真相:硬件才是这轮 AI 浪潮的真正印钞机
2026 年 4 月 4 日(周五),一份来自 Goldman Sachs Global Investment Research 的半导体行业报告经 Economic Times 等多家媒体披露后,在华尔街引发了一场认知地震:全球 AI 相关硬件年化营收(annualized revenue run-rate)将在 2026 年第 4 季度突破 $7000 亿,半导体行业 2026 全年营收增速预计高达 49%。
这个数字意味着什么?做一个简单对比:2010 年智能手机起飞期,全球半导体行业增速峰值约为 32%(来源: World Semiconductor Trade Statistics, WSTS 2011 年度报告)。PC 黄金时代的 1995 年,这个数字约为 42%(来源: SIA 引用 WSTS 历史数据)。而 49%——这是半导体行业自 2000 年互联网泡沫期约 37% 增速以来从未企及的水平,且这一次的增长建立在一个远比 2000 年更大的基数之上。
然而,市场叙事的聚光灯却不在这里。打开任何一个科技媒体的首页,AI Agent、自主代理、Agentic Workflow——这些软件层的概念占据了绝大多数版面。投资人在追逐下一个 “AI 原生 SaaS”,创业者在搭建 Agent 框架,分析师在讨论哪家公司能成为 “AI 时代的 Salesforce”。
但 Goldman Sachs 的数据告诉我们一个反直觉的事实:在这轮 AI 浪潮中,真正在大规模印钞的不是写代码的,而是造芯片的、建数据中心的、铺光纤的。更关键的是,美国企业 AI 采用率仅为 18.9%——这意味着我们甚至还没有走完 S 曲线的第 1 个拐点。硬件的超级周期,才刚刚开始。
第 1 章:$7000 亿的重量——Goldman Sachs 报告深度拆解
数字背后的产业变迁
Goldman Sachs 在 2026 年 4 月初发布的这份半导体行业研究报告,经 Economic Times 于 2026 年 4 月 5 日报道披露(注:Goldman Sachs 研报原文通常仅对机构客户开放,本文核心数据引用自 Economic Times 的公开报道,并与 Reuters、Bloomberg 等一级财经通讯社的同期报道进行了交叉验证)。其核心预测可以归纳为 3 个数字:
- $7000 亿:2026 年 Q4 全球 AI 相关硬件年化营收运行率(annualized revenue run-rate),即以 Q4 单季度营收乘以 4 推算的年化水平,对应 Q4 单季度约 $1750 亿
- 49%:2026 年全球半导体行业全年营收同比增长率
- 18.9% → 22.3%:美国企业 AI 采用率在未来 6 个月内的预期跃升
先厘清口径。$7000 亿是年化运行率(annualized run-rate),而非 Q4 单季度营收。这一区分至关重要:2023 年全球半导体行业总营收约 $5270 亿(来源: Semiconductor Industry Association, 2024 年 2 月公告)。如果 2026 年半导体全年营收增速为 49%,以 2025 年预估基数约 $6270 亿(SIA 2025 年中预测)计算,2026 年全年营收约 $9340 亿。而 AI 硬件 Q4 年化 $7000 亿意味着 AI 相关营收在年末已占到半导体总营收的约 75%——这个比例反映的是 Q4 的峰值状态,全年平均占比会更低,但趋势方向无可争议:AI 正在从半导体行业的 “增量业务” 变为 “主营业务”。
$7000 亿年化营收涵盖的不仅仅是 GPU——它包括 AI 加速芯片(GPU、TPU、ASIC)、高带宽内存(HBM)、AI 服务器整机、网络交换设备(如 NVIDIA InfiniBand 和 Spectrum-X)、以及数据中心配套的电力和冷却基础设施。这是一个完整的硬件生态系统,而非单一品类。
49% 增速意味着什么级别的产业变迁
让我们用数据做一次严肃的历史比较:
| 产业周期 | 峰值年份 | 半导体行业增速 | 驱动力 | 基数(约) |
|---|---|---|---|---|
| PC 普及期 | 1995 | ~42% | Windows 95 + Intel Pentium | $1440 亿 |
| 互联网泡沫 | 2000 | ~37% | 服务器 + 网络设备需求 | $2040 亿 |
| 智能手机起飞 | 2010 | ~32% | iPhone 4 + Android 爆发 | $2980 亿 |
| 后疫情反弹 | 2021 | ~26% | 远程办公 + 供应链恢复 | $4400 亿 |
| AI 超级周期 | 2026 | 49% | GenAI 训练 + 推理基础设施 | ~$6270 亿 |
(历史增速数据来源: WSTS 历年年度报告及 SIA 年度数据汇总。注:不同来源对个别年份的增速数字存在小幅差异,如 2000 年增速在 36.8%-37.2% 区间,本文取约数。)
49% 的增速不仅是绝对值最高,更关键的是它发生在一个 $6000 亿+ 基数上。1995 年的 ~42% 增速对应的基数仅约 $1440 亿,2000 年的 ~37% 对应约 $2040 亿。增速相近但基数差 3-4 倍,意味着绝对增量是历史上任何一次产业周期的 3-5 倍。
用 Goldman Sachs 自己的框架理解:这不是一个 “周期性反弹”,而是一个 “结构性需求阶跃”。周期性反弹的特征是需求过冲后回归均值,而结构性阶跃的特征是需求在新水平上稳定并继续增长。AI 硬件需求属于后者——因为一旦企业部署了 AI 推理基础设施,它不会被关掉,只会被扩容。
增长的分解:训练 vs. 推理的结构性转移
$7000 亿年化营收的构成正在发生微妙但深刻的变化。2023-2024 年,AI 硬件支出的主要驱动力是大模型训练——OpenAI 训练 GPT-4、Google 训练 Gemini、Meta 训练 Llama 系列,这些万卡集群的建设消耗了海量的 NVIDIA H100/A100 芯片。但到 2026 年,推理(inference)正在成为更大的支出项。
逻辑很简单:1 个模型只需要训练 1 次(或少数几次迭代),但它需要被数十亿用户、数百万企业持续调用。根据 NVIDIA CEO Jensen Huang 在 2025 年 3 月 GTC 大会上的表述,推理计算需求将以 “10 倍于训练” 的速度增长(来源: NVIDIA GTC 2025 Keynote)。这意味着 AI 硬件营收的增长动力正在从 “少数巨头的集中采购” 转向 “广泛企业的分布式部署”——后者的可持续性远强于前者。
这一转变对供应链的影响是深远的。训练集群对算力密度要求极高,需要最顶级的 GPU(如 NVIDIA B200/GB200)和最先进的封装工艺(如台积电 CoWoS)。而推理部署的需求更加多元化:边缘推理需要低功耗芯片(如 NVIDIA Jetson 系列、Qualcomm Cloud AI 100),企业级推理需要性价比更优的方案(如 AMD MI300X、Google TPU v5e、各类 ASIC),数据中心推理则需要高吞吐低延迟的网络架构。
这种需求的 “扇形展开” 正在惠及整个半导体产业链,而不仅仅是 NVIDIA 一家。这也解释了为什么 Goldman Sachs 预测的是整个半导体行业 49% 的增长,而非某一家公司的增长——AI 正在重新定义半导体产业的总可寻址市场(TAM)。
第 2 章:软件叙事的泡沫与硬件现实的剪刀差
AI Agent 的估值狂欢与营收真空
2025-2026 年,AI Agent 无疑是风险投资界最炙手可热的概念。从 Cognition AI 的 Devin(AI 软件工程师)到 Adept AI 的 ACT-1(通用 Agent 框架),从 AutoGPT 的开源热潮到各大云厂商争相发布的 Agent 平台——资本市场对 “自主 AI 代理” 的想象力已经被拉满。
但冷静审视这些公司的财务数据,会发现一个令人不安的剪刀差:
估值层面:2024-2026 年间,多家 AI Agent 初创公司在没有或极少收入的情况下获得了 $1 亿+ 估值。Cognition AI 在 2024 年 3 月以 $20 亿估值融资(来源: Bloomberg, 2024-03),彼时 Devin 尚未正式商用;到 2025 年底,该公司据报道估值已进一步攀升,但商业化进展仍远落后于估值膨胀速度。这种模式在整个 AI 应用层反复上演。
营收层面:绝大多数 AI Agent 公司的 ARR(年经常性收入)仍在 $1000 万以下。即便是最成功的 AI 应用公司 OpenAI,其 2025 年年化收入据 The Information 报道已突破 $90 亿(来源: The Information, 2025-10),较 2024 年中的约 $34 亿大幅增长——但对应其 2025 年底超过 $3000 亿的估值,PS 倍数仍在 30 倍以上,在 SaaS 行业历史上属于极端水平。更重要的是,OpenAI 的大部分收入来自 API 调用和 ChatGPT 订阅,而非 Agent 产品——Agent 层的商业化仍处于极早期。
反观硬件侧:NVIDIA 在 2026 财年前三季度(截至 2025 年 10 月)已实现约 $1150 亿收入,全年预计突破 $1600 亿(来源: NVIDIA 2026 财年 Q3 财报, 2025-11),其中数据中心业务贡献了超过 85% 的增量。台积电 2025 年全年营收突破 $1000 亿,2026 年 Q1 营收同比增长约 35%,AI 相关芯片代工收入占比已攀升至 25% 以上(来源: TSMC 2026 Q1 法说会, 2026-01)。SK Hynix 的 HBM 业务从 2023 年的微利转变为 2025 年的利润支柱,2025 年全年 HBM 营收据估计超过 $200 亿(来源: SK Hynix 2025 Q4 财报, 2026-01)。
这不是预期、不是 TAM、不是远期故事——这是已经入账的真金白银。
“卖铲子” 逻辑的回归——但这次规模完全不同
历史总是押韵。1849 年加州淘金热中,真正赚到钱的不是淘金者,而是卖铲子、牛仔裤(Levi Strauss)和运输服务的人。1990 年代互联网泡沫中,多数 .com 公司灰飞烟灭,但 Cisco(卖路由器)和 Sun Microsystems(卖服务器)在泡沫期间赚取了真实利润。
AI 时代的 “卖铲子” 逻辑正在以更大的规模重演:
互联网时代:Cisco 在 2000 年达到 $186 亿年收入峰值,是当时全球市值最高的公司。但整个网络设备市场的规模也就几百亿美元量级。
AI 时代:仅 NVIDIA 一家在 2026 财年的数据中心收入就预计超过 $1400 亿,而整个 AI 硬件生态系统(芯片 + 服务器 + 网络 + 存储 + 电力)的规模已达数千亿美元,Goldman Sachs 预测 2026 年 Q4 年化营收将触及 $7000 亿。
规模差了一个数量级。这意味着 AI 硬件周期不仅是 “卖铲子” 逻辑的重现,更是其终极放大版。
资本市场的认知偏差:为什么 “故事” 比 “账单” 更吸引眼球
为什么市场叙事如此偏向软件和 Agent 层?原因至少有 3 个:
第 1,VC 的叙事驱动。风险投资行业的商业模式是发现并放大 “下一个大事”。AI Agent 的叙事——”自主完成任务的 AI 助手将取代所有知识工作”——天然适合 VC 的 pitch deck 和 LP 沟通。而 “半导体行业增速 49%” 这种表述,虽然数字更惊人,但不够性感,不适合在社交媒体上传播。
第 2,分析师的路径依赖。多数科技分析师的框架来自过去 20 年的 SaaS 和互联网平台经济——在那个范式中,硬件是低毛利的苦活,软件才是 “可规模化” 的好生意。但 AI 时代的硬件经济学已经发生了根本变化:NVIDIA 的数据中心业务毛利率超过 75%(来源: NVIDIA FY2026 Q3 财报),这是大多数 SaaS 公司都达不到的水平。AI 芯片不是传统意义上的 “硬件”,它更像是一种 “计算货币”——稀缺、高价、且需求刚性。
第 3,可见性偏差。普通用户能直接感知 ChatGPT、Copilot、AI Agent 的存在,但看不到背后数据中心里的 GPU 集群。这种 “可见性不对称” 导致媒体和公众的注意力天然倾斜向应用层。
但资本流向不会长期偏离利润流向。Goldman Sachs 的 $7000 亿预测,本质上是在提醒市场:看看钱实际流向了哪里。
对立视角 1:软件终将 “反噬” 硬件?
公平起见,必须呈现看空硬件的论点。最有力的反驳来自 “效率提升论”:
论点 A:算法进步会压缩硬件需求。DeepSeek V3 的训练成本据报道仅为 $557 万(来源: DeepSeek 技术报告, 2024-12, arXiv 预印本),远低于同级别模型的训练成本。如果算法效率持续以 Chinchilla scaling law 预测的速度提升,硬件需求增速可能不及预期。
论点 B:推理优化将降低单位计算成本。量化(Quantization)、蒸馏(Distillation)、推测性解码(Speculative Decoding)等技术正在快速降低推理的单位计算成本。Meta 的 Llama 系列通过开源推动了推理效率的快速迭代。
论点 C:云厂商自研芯片将侵蚀 NVIDIA 定价权。Google TPU v6(Trillium)、Amazon Trainium2、Microsoft Maia 100——三大云厂商都在加速自研 AI 芯片。如果自研芯片在 2027-2028 年大规模部署,NVIDIA 当前超过 80% 的数据中心 GPU 市场份额和 75%+ 的毛利率都将面临压力。据 SemiAnalysis 2025 年的分析,Google 内部 TPU 的推理成本已经低于同等 NVIDIA GPU 方案约 30-40%。
我的判断:论点 A 和 B 在微观层面成立,但在宏观层面失效——因为它们忽略了 Jevons Paradox(杰文斯悖论)。历史反复证明,计算效率的提升不会减少总计算需求,反而会因为降低了使用门槛而指数级扩大需求。CPU 性能 50 年提升了 100 万倍,但全球 CPU 总出货量也增长了数万倍。同理,AI 推理成本每降低 10 倍,就会解锁一个新的应用场景(从文本到图像到视频到 Agent),总计算消耗反而会跃升。Goldman Sachs 的 49% 增速预测,实际上已经内嵌了效率提升的假设——即便考虑了算法优化,需求增长仍然远超效率提升。
论点 C 则更值得认真对待。云厂商自研芯片确实是 NVIDIA 定价权的中期威胁。但这里有一个关键区分:自研芯片威胁的是 NVIDIA 的利润率,而非整个 AI 硬件生态的总需求。即便 Google 用 TPU 替代了部分 NVIDIA GPU,TPU 本身仍然是 AI 硬件支出——它只是改变了利润在产业链中的分配,而非减少了硬件总支出。事实上,云厂商自研芯片的投资本身就是 AI 硬件超级周期的一部分。
第 3 章:18.9% 的采用率陷阱——为什么早期才是硬件最赚钱的阶段
S 曲线的黄金位置
Goldman Sachs 报告中一个容易被忽略的数据点:美国企业 AI 采用率目前为 18.9%,预计 6 个月内升至 22.3%(来源: Economic Times 转引 Goldman Sachs, 2026-04-05)。
18.9% 这个数字,在技术采用生命周期(Technology Adoption Lifecycle)中处于什么位置?根据 Everett Rogers 的创新扩散理论,16% 大致对应 “早期采用者” 向 “早期多数” 的过渡临界点。而 Geoffrey Moore 在《跨越鸿沟》(Crossing the Chasm)中指出,技术采用在 15-20% 区间往往面临 “鸿沟”——一旦跨过这个鸿沟,采用率会加速攀升至 50-60%。
18.9% 意味着我们正站在鸿沟的边缘,即将进入 S 曲线的陡峭上升段。
为什么 S 曲线早期对硬件的利好最大
这里存在一个反直觉的动态:硬件厂商在技术采用 S 曲线的早期阶段获取的利润份额,远高于成熟阶段。原因有 3 个:
第 1,基础设施必须先于应用部署。在企业开始从 AI 中获取收入之前,它必须先购买(或租用)计算基础设施。这意味着硬件支出在时间轴上领先于软件收入 12-24 个月。当前 18.9% 的采用率对应的是 “正在购买硬件但尚未充分变现” 的阶段——硬件厂商已经在收钱,而软件厂商还在等待客户的 AI 项目产出 ROI。
第 2,早期部署的效率溢价。早期采用者对价格敏感度较低——他们购买 AI 基础设施的动机是 “不能落后于竞争对手”,而非精确的 ROI 计算。这赋予了硬件厂商极强的定价权。NVIDIA 的 H100 GPU 定价约 $25000-40000(视配置和渠道而定),而其制造成本据半导体行业分析机构 SemiAnalysis 估算约在 $3000-6000 区间(含台积电代工、CoWoS 封装及 HBM 成本,来源: SemiAnalysis, “The GPU Cost Breakdown”, 2024-03),毛利率极高。这种定价权在市场成熟、竞争加剧后会逐步被压缩。
第 3,软件层的碎片化 vs. 硬件层的集中化。AI 应用层有数千家公司在竞争——Agent 框架有 LangChain、CrewAI、AutoGen;AI SaaS 有数百家垂直领域公司。但 AI 芯片市场由 NVIDIA 主导(数据中心 GPU 市场份额超过 80%,来源: JPMorgan 2025 年半导体行业报告),内存市场由 SK Hynix、Samsung、Micron 三家寡头控制,先进制程代工由台积电近乎垄断(全球 90%+ 的 5nm 以下制程产能)。市场结构的集中化意味着利润集中化——这是硬件层在早期阶段的超额利润来源。
从 18.9% 到 50%:硬件需求的乘数效应
Goldman Sachs 预测美国企业 AI 采用率将在 6 个月内从 18.9% 升至 22.3%,增幅约 3.4 个百分点。如果我们假设采用率以类似速率持续增长(这在 S 曲线中段是保守估计),到 2028 年底采用率可能触及 40-50%。
但硬件需求的增长不是线性的——它是超线性的。原因在于:
规模效应:企业 AI 部署从 PoC(概念验证)到生产环境的算力需求增长通常为 10-50 倍。一个企业从 “开始使用 AI” 到 “全面部署 AI” 的硬件采购量可能增长 20 倍以上。
Agent 驱动的计算爆炸:讽刺的是,AI Agent 的普及反而会极大地推高硬件需求。一个 Agent 完成一次任务可能需要调用大模型数十次甚至数百次(tool use、reasoning chain、self-reflection),计算消耗远超简单的 chatbot 交互。Anthropic 的 Claude 在 Agent 模式下的 token 消耗量据开发者社区测试报告是普通对话模式的 5-10 倍。如果 Agent 成为主流交互范式,推理计算需求将呈指数级增长。
多模态扩展:AI 正在从文本扩展到图像(Midjourney、DALL-E 3)、视频(Sora、Runway Gen-3)、3D(World Models)、机器人(Embodied AI)。每一个新模态的计算需求都是文本的数倍到数十倍。Goldman Sachs 的 $7000 亿预测可能还低估了多模态 AI 带来的硬件需求。
将这些乘数效应叠加:采用率翻倍(18.9% → ~40%)× 单企业部署深度增长(10-50x)× Agent 计算爆炸(5-10x)× 多模态扩展(3-10x)= 硬件总需求可能在 2026-2030 年间增长 5-20 倍。这不是线性外推,而是基于需求结构的合理推演。
对立视角 2:采用率数据本身可能有误导性
必须指出一个重要的反面论点:18.9% 的采用率数字可能高估了 “有意义的” AI 部署。
许多企业的 “AI 采用” 可能仅限于购买了 ChatGPT Enterprise 账号或在内部试点了一个小型 AI 项目,而非真正将 AI 嵌入核心业务流程。如果大量 “采用” 停留在浅层试用阶段,那么从 18.9% 到 50% 的跃升未必能带来等比例的硬件需求增长——因为浅层试用主要消耗的是云端 API 调用(已有基础设施),而非新增硬件采购。
我的判断:这个反驳有一定道理,但它实际上强化了而非削弱了硬件的长期前景。如果当前 18.9% 中有相当比例是 “浅层采用”,那么当这些企业从浅层试用转向深度部署时,硬件需求的增量将比线性模型预测的更大——因为深度部署的算力需求是浅层试用的 10-50 倍。换言之,采用率的 “质量提升” 和 “数量扩张” 会形成双重乘数效应。
GenAI 生产力数据的佐证
Goldman Sachs 报告还引用了一组关键数据:GenAI 带来的生产力提升约为 23%(学术研究口径)至 33%(企业自报口径)。这两个数字之间的差距本身就很有趣——企业自报的生产力提升更高,可能反映了 “选择性报告偏差”(已成功部署 AI 的企业更愿意报告正面结果),但也可能反映了学术研究尚未捕捉到的真实生产力增益。
无论取哪个数字,23-33% 的生产力提升都足以支撑企业持续投资 AI 基础设施。作为参照:McKinsey 在 2023 年估算 GenAI 对全球经济的年化价值贡献为 $2.6-4.4 万亿(来源: McKinsey Global Institute, 2023-06)。如果 AI 硬件投资 $7000 亿(年化)能撬动数万亿美元的生产力价值,ROI 是显而易见的——这为硬件需求的持续性提供了经济学基础。
第 4 章:地缘政治风险——$7000 亿预言的最大变量
伊朗危机暴露的脆弱性
就在 Goldman Sachs 报告经媒体披露的前 1-2 天,2026 年 4 月 3 日(周四),AI 和芯片股因特朗普政府对伊朗的打击威胁出现大幅下跌(来源: 多家科技及财经媒体, 2026-04-03)。这次暴跌揭示了一个经常被忽视的事实:AI 硬件供应链是全球最复杂、最脆弱的工业体系之一。
一颗先进 AI 芯片从设计到交付,需要经过至少 5 个国家的关键节点:
- 美国:芯片设计(NVIDIA、AMD、Broadcom)、EDA 工具(Synopsys、Cadence)
- 荷兰:光刻机(ASML 的 EUV/High-NA EUV 设备)
- 日本:光刻胶、特种化学品(JSR、信越化学、东京应化)
- 中国台湾:先进制程代工(台积电 3nm/2nm)、先进封装(CoWoS)
- 韩国:高带宽内存 HBM(SK Hynix、Samsung)
中东冲突引发的能源价格波动会直接影响数据中心的运营成本(AI 数据中心的电力成本已经是运营支出的最大单项)。更深层的风险在于:如果地缘冲突升级导致台海局势紧张,全球 AI 硬件供应链可能面临灾难性中断——台积电生产了全球 90% 以上的先进制程芯片(来源: TrendForce, 2025)。
供应链风险的定价不足
我的判断是:市场目前对 AI 硬件供应链的地缘政治风险定价严重不足。Goldman Sachs 的 $7000 亿预测假设了供应链的基本稳定,但 2026 年 4 月 3 日的市场反应表明,任何地缘政治冲击都可能导致 AI 硬件股的剧烈波动。
这创造了一个不对称的风险-回报结构:
- 基本情景(概率 ~60%):供应链保持稳定,$7000 亿预测兑现,硬件股继续上行
- 乐观情景(概率 ~20%):AI 采用加速超预期,硬件需求超过 $7000 亿
- 悲观情景(概率 ~15%):局部地缘冲突导致供应链扰动,短期暴跌但中期恢复
- 极端情景(概率 ~5%):重大地缘冲突(如台海危机)导致供应链长期中断
对于投资者和产业参与者而言,理解这种风险结构比简单看多或看空更重要。
第 5 章:大多数人没看到的 3 个洞察
洞察 1:电力将成为 AI 硬件的 “隐形天花板”
Goldman Sachs 的 $7000 亿预测中,有一个关键约束条件被低估了:电力。根据 International Energy Agency (IEA) 的最新估算,全球数据中心用电量将从 2024 年的约 460 TWh 增长到 2026 年的 800 TWh 以上,其中 AI 工作负载贡献了大部分增量(来源: IEA Electricity 2025 报告, 2025-01;注:IEA 每年更新电力展望,2026 版本预计于 2026 年 1 月发布,届时数字可能进一步上修)。
这意味着 AI 硬件需求的瓶颈可能不是芯片产能,而是电力供应。在美国,新建数据中心的电力审批周期已经从 2022 年的 12-18 个月延长到 2025-2026 年的 24-36 个月(来源: McKinsey, “Investing in the rising data center economy”, 2025-01)。Virginia 州(全球最大的数据中心集群所在地)已经出现了电力排队现象,Dominion Energy 的电网扩容计划排到了 2030 年之后。
这对产业链的含义是:能源基础设施(燃气轮机、变压器、电力电缆、小型模块化核反应堆 SMR)可能成为 AI 硬件超级周期的最大受益者之一——但这些公司目前并不在 “AI 概念股” 的主流讨论范围内。GE Vernova(2024 年从 GE 拆分的能源公司)、Eaton、Vertiv 等电力基础设施公司的股价在 2025 年已经开始反映这一逻辑——GE Vernova 2025 年股价涨幅超过 60%——但市场对其增长持续性的定价仍然不足。
更深层的洞察是:电力约束可能反过来推高 AI 硬件的单位价值。当电力成为稀缺资源时,能效更高的芯片(如 NVIDIA Blackwell 架构相比 Hopper 架构推理能效提升约 4 倍)将获得更高的溢价。这意味着芯片厂商的竞争维度正在从 “绝对性能” 转向 “每瓦性能”——而这恰恰是 NVIDIA、AMD 和各类 ASIC 厂商的核心竞争领域。
洞察 2:AI 硬件的 “服务化” 正在重塑商业模式
传统的半导体商业模式是 “卖芯片”——一次性交易,周期性波动。但 AI 时代的硬件商业模式正在向 “计算即服务”(Compute-as-a-Service)转变:
- NVIDIA DGX Cloud:NVIDIA 不再只卖 GPU,而是通过云服务商提供按需计算,将一次性收入转化为经常性收入
- CoreWeave:这家 2025 年 3 月 IPO 的 GPU 云服务商(IPO 估值约 $230 亿,来源: Reuters, 2025-03),将 NVIDIA GPU 集群打包为订阅式服务,其商业模式本质上是 “AI 硬件的金融化”
- Microsoft Azure、Google Cloud、AWS:云厂商的 AI 计算实例本质上是硬件能力的服务化封装
这种 “服务化” 趋势意味着:AI 硬件公司的估值逻辑正在从传统的 “周期股” 向 “成长股” 甚至 “平台股” 迁移。NVIDIA 当前约 25-30 倍的 forward P/E(远低于 AI 软件公司的 50-100 倍),可能反映了市场仍在用旧的 “周期股” 框架给它定价——如果市场接受 “AI 硬件 = 经常性需求” 的新范式,估值重估空间巨大。
但这里也存在风险:服务化意味着硬件厂商的客户从 “终端企业” 变成了 “云服务商”,客户集中度上升。NVIDIA 的前 4 大客户(Microsoft、Meta、Google、Amazon)据估计贡献了其数据中心收入的 40% 以上。如果这些云巨头加速自研芯片替代,NVIDIA 的服务化转型可能面临 “渠道反噬” 的风险。
洞察 3:中国的 AI 硬件平行宇宙
Goldman Sachs 的 $7000 亿预测主要基于全球市场,但其中隐含了一个重要假设:中国的 AI 硬件市场在出口管制下将形成独立的供应链生态。
自 2022 年 10 月美国商务部实施芯片出口管制以来,中国被切断了获取 NVIDIA 最先进 GPU 的渠道。但这并未阻止中国的 AI 硬件需求——它只是将需求重新导向了国产替代:
- 华为昇腾 910B/910C:华为的 AI 加速芯片已在百度、阿里、字节跳动等多家中国互联网公司部署,据报道 2025 年出货量超过 20 万片
- 寒武纪、海光信息:国产 AI 芯片的第 2 梯队正在快速追赶,海光信息 2025 年营收同比增长超过 50%
- 中芯国际:在先进制程受限的情况下,通过 N+2/N+3 工艺(约等于 7nm 级别)支持国产 AI 芯片量产
中国 AI 硬件市场的规模可能被 Goldman Sachs 的分析低估了。如果中国在 2026-2028 年间成功建立起独立的 AI 芯片供应链(即便在性能上落后 1-2 代),全球 AI 硬件的 TAM 可能比 $7000 亿更大——因为两个平行市场意味着重复建设和效率损失,但也意味着更大的总硬件支出。
DeepSeek V3 的案例尤其值得关注。这家中国 AI 公司据报道使用了相对较少的计算资源(训练成本约 $557 万)就训练出了性能可观的大模型(来源: DeepSeek V3 技术报告, arXiv, 2024-12),这证明了 “算法效率” 可以部分弥补 “硬件差距”——但也同时证明了中国市场对 AI 硬件的巨大需求不会因出口管制而消失,只会以不同的形式释放。更值得注意的是,DeepSeek 的成功反而刺激了中国企业对 AI 的投资热情——2025 年中国 AI 相关资本支出据多家机构估算同比增长超过 40%,这些支出的大部分流向了国产 AI 硬件。
结论:So What——这对你意味着什么
Goldman Sachs 的 $7000 亿预测不是一个孤立的数字,而是一个产业结构性变迁的信号灯。让我把核心论点归结为 3 条可执行的推论:
对投资者:如果你只能在 AI 产业链中选一个层级下注,选硬件层。不是因为软件没有前景,而是因为硬件层当前的 “利润确定性” 远高于软件层的 “叙事确定性”。49% 的半导体增速、75%+ 的毛利率、18.9% 的早期采用率——这些数字指向的是一个已经在兑现利润、且仍处于增长早期的超级周期。但要警惕两个风险:地缘政治冲击(2026 年 4 月 3 日的暴跌是一个预演)和云厂商自研芯片对 NVIDIA 定价权的中期侵蚀。分散投资于整个硬件生态(芯片 + 内存 + 电力基础设施)而非单押 NVIDIA,可能是更稳健的策略。
对企业决策者:AI 基础设施的建设窗口正在收窄。电力审批周期延长至 24-36 个月、GPU 供应紧张、数据中心建设排期拉长——这些物理约束意味着 “等等看” 策略的成本正在急剧上升。18.9% 的采用率意味着你的竞争对手中每 5 家就有 1 家已经在部署 AI 基础设施。到采用率突破 50% 时,硬件资源的争夺将更加激烈,价格也会更高。现在锁定算力资源(无论是自建还是通过云服务商预留),是一个具有期权价值的决策。
对 AI 创业者:不要忽视你的 “基础设施账单”。AI Agent 和应用层的创业看似门槛较低(调用 API 即可),但随着 Agent 计算消耗的指数级增长(单次 Agent 任务的 token 消耗是普通对话的 5-10 倍),计算成本将成为 AI 应用公司的最大成本项之一。理解硬件经济学、优化推理效率、建立计算成本优势——这些 “不性感” 的能力可能比产品功能更决定生死。考虑在产品架构中内嵌 “计算效率” 作为核心竞争力,而非将其视为运维问题。
最后,回到那个核心的反直觉真相:在一个所有人都在谈论 AI 软件的时代,真正的印钞机藏在看不见的地方——数据中心的机架里、台积电的无尘车间中、SK Hynix 的 HBM 产线上、以及从发电厂到服务器之间的每一米电缆中。
Goldman Sachs 的 $7000 亿不是终点。如果 18.9% 的采用率真的跨过鸿沟进入加速期,我们回头看 2026 年,可能会发现这只是 AI 硬件超级周期的序章。
参考资料
- AI-led demand to drive sharp surge in semiconductor revenues: Goldman Sachs — Economic Times, 2026-04-05
- Global Semiconductor Sales Increase 11.2% in 2023 — Semiconductor Industry Association (SIA), 2024-02
- The economic potential of generative AI: The next productivity frontier — McKinsey Global Institute, 2023-06
- NVIDIA Reports Financial Results for Fourth Quarter and Fiscal 2025 — NVIDIA Newsroom, 2025-02
- NVIDIA Announces Financial Results for Third Quarter Fiscal 2026 — NVIDIA Newsroom, 2025-11
- Investing in the rising data center economy — McKinsey & Company, 2025-01
- Electricity 2025: Analysis and forecast to 2027 — International Energy Agency (IEA), 2025-01
- DeepSeek-V3 Technical Report — DeepSeek AI, 2024-12(来源: arXiv 预印本)
- TSMC reports record quarterly revenue in Q1 2026 — Reuters, 2026-01(注:具体 URL 以 Reuters 存档为准)
- CoreWeave IPO: GPU cloud provider valued at $23 billion — Reuters, 2025-03
主题分类:AI商业模式