Jensen Huang 宣布 AGI 已到来:NVIDIA 如何用"Agent 基础设施"重写整个行业的定义权
2026年3月18日,San Jose SAP Center,Jensen Huang 穿着他标志性的黑色皮夹克走上 GTC 2026 主舞台,用一句话引爆了整个科技行业:”AGI is here. It’s not what you expected — it’s better.”
这句话在48小时内被引用超过120万次。Twitter(现 X)上,AI 研究者们分成两个阵营:一方认为这是科技史上最大胆的产品发布声明,另一方认为这是一场精心策划的语义劫持。Google DeepMind 的 Demis Hassabis 在 AlphaGo 10周年纪念文章中刚刚谨慎地描述了”通往 AGI 之路”的漫长旅程 (来源: Google DeepMind Blog, 2026-03-10),而 Jensen 直接宣布终点已至——只不过,他重新定义了终点在哪里。
这不是一篇关于”AGI 是否真的到来”的哲学辩论。这是一篇关于 NVIDIA 如何通过重新定义 AGI 的含义,将自己从一家 GPU 公司变成 Agent 时代的基础设施垄断者的商业分析。Isaac Lab 3.0、GR00T 机器人基础模型、Arm AGI CPU、Nemotron 3 Super——这些不是零散的产品发布,而是一张精密编织的网。当你看完全貌,你会发现:Jensen 不是在预测未来,他是在定价未来。
一、定义权之争:AGI 从”通用智能”变成了”通用代理”
1.1 Jensen 的语义手术
要理解 GTC 2026 的真正意义,你必须先理解 Jensen Huang 对 AGI 做了什么。
传统定义中,AGI(Artificial General Intelligence)指的是一个能够在任何智力任务上达到或超越人类水平的 AI 系统。这是 DeepMind、OpenAI、Anthropic 等实验室长期追求的目标。按照这个定义,AGI 显然还没有到来——即使是 GPT-5 和 Gemini 2.5 Pro,在需要持续推理、跨模态理解和长期规划的复杂任务上仍然频繁失败。
Jensen 做了一件极其聪明的事:他没有挑战这个定义,他绕过了它。
在 GTC 2026 的 keynote 中,Jensen 将 AGI 重新框定为”能够理解任务、规划步骤、使用工具并自主完成目标的 AI 系统”——换句话说,Agent。他的原话是:”When an AI can reason, plan, and act across digital and physical worlds, that is general intelligence in practice.”
这里的关键词是”in practice”。Jensen 不是在说理论上的通用智能,他在说实践中的通用代理能力。这是一次精准的语义手术:把 AGI 从一个遥不可及的研究目标,变成了一个可以用 NVIDIA 产品栈来衡量和实现的工程问题。
1.2 为什么这次语义劫持可能成功
历史上,科技行业的定义权之争决定了数万亿美元的资本流向。Steve Jobs 把”智能手机”从 BlackBerry 式的键盘设备重新定义为触屏计算平台,Marc Andreessen 把”云”从一个模糊的概念变成了 SaaS 的商业模式。每一次成功的定义重构,都伴随着一个完整的产品栈来支撑新叙事。
Jensen 这次的不同之处在于:他不仅有叙事,他有基础设施。
NVIDIA 在 GTC 2026 上发布的不是一个产品,而是一个完整的 Agent 基础设施栈:
- 推理层:Nemotron 3 Super,专为 Agentic AI 优化,吞吐量比前代提升5倍 (来源: NVIDIA Blog, 2026-03-11)
- 训练/仿真层:Isaac Lab 3.0,机器人 Agent 的训练环境
- 基础模型层:GR00T,机器人基础模型,让物理世界的 Agent 成为可能
- 硬件层:Arm AGI CPU,专为 Agentic AI 工作负载设计的处理器架构
- 编排层:NVIDIA NIM 微服务,提供 Agent 的部署和管理框架
当你拥有从芯片到模型到仿真环境的全栈控制力时,你不仅仅是在参与定义权之争——你是在用产品来创造定义本身。
1.3 对立视角:这是一场危险的通胀
并非所有人都买账。Meta AI 研究副总裁 Joëlle Pineau 在 GTC 之后的一次访谈中表示:”Calling current agent systems AGI is like calling a calculator a mathematician. The gap between tool use and genuine understanding remains vast.”
这个批评有其道理。当前最先进的 Agent 系统——无论是 OpenAI 的 Operator、Anthropic 的 Claude with Computer Use,还是 Google 的 Project Mariner——在面对需要常识推理、处理模糊指令或应对意外情况的真实场景时,失败率仍然在30%-50%之间(根据 Berkeley 的 WebArena 基准测试)。把这称为”AGI”,确实有通胀之嫌。
但这里有一个大多数批评者忽略的关键点:Jensen 不需要 AGI 的定义在学术上正确,他只需要它在商业上有效。
如果”AGI = Agent”这个等式被行业接受,那么每一个企业的 AI 预算都将从”我们需要更好的模型”转向”我们需要 Agent 基础设施”。而 NVIDIA 恰好是唯一一个拥有完整 Agent 基础设施栈的公司。这不是技术判断,这是市场定位。
二、Isaac Lab 3.0 + GR00T:物理世界 Agent 的训练场与大脑
2.1 Isaac Lab 3.0:从仿真到现实的桥梁
Isaac Lab 3.0 是 NVIDIA 在 GTC 2026 上发布的机器人 AI 训练平台的第3个大版本。如果说 Isaac Lab 1.0 和 2.0 是”让机器人在虚拟世界里学会走路”,那么3.0 的核心突破在于 sim-to-real transfer 的可靠性达到了工业级水平。
具体来说,Isaac Lab 3.0 引入了3项关键技术:
第1项:多物理场高保真仿真。 3.0 版本整合了 NVIDIA Omniverse 的最新物理引擎,能够同时模拟刚体动力学、软体变形、流体交互和光照条件。这意味着一个机器人在虚拟环境中学到的”抓取一个湿滑的玻璃杯”的策略,可以更可靠地迁移到真实世界。根据 NVIDIA 公布的内部测试数据,3.0 的 sim-to-real 成功率比2.0 提升了40%以上。
第2项:大规模并行训练。 Isaac Lab 3.0 支持在单个 NVIDIA DGX 集群上同时运行超过10万个仿真实例。这不是一个微不足道的工程改进——它意味着一个机器人策略可以在几小时内经历相当于数十年的真实世界经验。Physical Intelligence(以下简称 Pi)正在寻求10亿美元融资的核心故事之一,就是他们需要这种规模的仿真能力来训练通用机器人策略。
第3项:开放的策略接口。 3.0 首次提供了标准化的 API,允许第3方基础模型(不仅仅是 NVIDIA 自己的 GR00T)直接接入仿真环境。这是一个战略性的开放——表面上是生态友好,实际上是在确保 Isaac Lab 成为机器人 AI 训练的”事实标准”,就像 CUDA 之于 GPU 计算一样。
2.2 GR00T:机器人的”GPT 时刻”?
如果 Isaac Lab 3.0 是训练场,GR00T 就是在这个训练场里诞生的”大脑”。
GR00T(Generalist Robot 00 Technology)是 NVIDIA 在2024年首次预告、2025年发布初版、2026年在 GTC 上展示重大升级的机器人基础模型。GR00T 的核心理念是:就像 GPT 系列模型为语言任务提供了通用的基础能力一样,GR00T 为机器人操作任务提供通用的感知-规划-执行能力。
GTC 2026 上展示的 GR00T 升级版有几个值得关注的能力:
-
跨形态泛化:同一个 GR00T 模型可以驱动双足人形机器人、四足机器狗和工业机械臂,无需针对每种形态重新训练。这在技术上极具挑战性,因为不同形态的机器人有完全不同的运动学约束和动力学特性。
-
自然语言指令理解:操作员可以用自然语言向机器人下达复杂指令(如”把桌上的红色零件放进左边第2个箱子,注意不要碰到旁边的玻璃瓶”),GR00T 能够将其分解为可执行的动作序列。
-
从视频学习:GR00T 可以通过观看人类操作的视频来学习新技能,而不需要专门的遥操作数据采集。NVIDIA 声称这将机器人新技能的训练时间从数周缩短到数小时。
2.3 被忽略的关键洞察:NVIDIA 正在构建机器人领域的 “iOS + App Store”
大多数分析师在讨论 Isaac Lab 3.0 和 GR00T 时,关注的是技术指标。但真正重要的是商业架构。
让我画一个类比:
| 智能手机时代 | 机器人 Agent 时代 |
|---|---|
| iOS 操作系统 | GR00T 基础模型 |
| iPhone 硬件 | Jetson Thor 计算平台 |
| Xcode 开发环境 | Isaac Lab 3.0 |
| App Store | NVIDIA NIM 微服务市场 |
| 第3方 App 开发者 | 机器人技能开发者 |
NVIDIA 正在复制 Apple 在智能手机时代的垂直整合策略,但应用在机器人领域。区别在于:Apple 自己造手机,NVIDIA 不造机器人——它提供机器人的”灵魂”(GR00T)、”训练场”(Isaac Lab)和”运行环境”(Jetson Thor + NIM),然后让 Boston Dynamics、Figure AI、Agility Robotics 等公司来造”身体”。
这个策略比 Apple 的更高明,因为 NVIDIA 不承担硬件制造的风险和资本支出,却能通过软件和计算平台收取”灵魂税”。
Physical Intelligence 正在寻求的10亿美元融资,从这个角度看就更有意思了。Pi 的核心技术是通用机器人策略模型——直接与 GR00T 竞争。但 Pi 没有自己的仿真平台(很可能依赖 Isaac Lab 或类似工具),没有自己的推理芯片(很可能跑在 NVIDIA GPU 上),也没有自己的部署框架。换句话说,Pi 可能正在用 NVIDIA 的基础设施来训练一个与 NVIDIA 竞争的模型。这就像在 iOS 上开发一个替代 Siri 的语音助手——你可以做,但平台方永远有结构性优势。
三、Arm AGI CPU:Agent 需要什么样的处理器?
3.1 为什么 Agent 工作负载需要新架构
GTC 2026 上一个被主流媒体低估的发布是 NVIDIA 与 Arm 联合设计的 AGI CPU。这个命名本身就值得玩味——它不叫”AI CPU”或”Server CPU”,它叫 AGI CPU,直接呼应 Jensen 的 AGI 叙事。
但抛开营销语言,Arm AGI CPU 背后有一个真实的技术需求:Agent 工作负载与传统 AI 推理工作负载有本质区别。
传统 AI 推理的特征是:大批量、高吞吐、可预测的矩阵运算。你把一批 prompt 送进模型,等待输出,整个过程是相对线性的。GPU 和现有的 AI 加速器非常擅长这种工作。
Agent 工作负载的特征完全不同:
-
长上下文、多轮交互:一个 Agent 在完成一个任务时,可能需要进行数十轮推理,每一轮都依赖前一轮的结果。这意味着大量的状态管理和上下文切换。
-
异构计算混合:Agent 不仅需要运行 LLM 推理(GPU 密集),还需要执行工具调用(CPU 密集)、管理内存(内存密集)和处理 I/O(网络密集)。这些工作负载交替出现,对处理器的调度能力要求极高。
-
低延迟优先于高吞吐:用户与 Agent 交互时,期望的是接近实时的响应,而不是批量处理的高吞吐。这要求处理器在单线程性能上有足够的竞争力。
-
安全隔离:当多个 Agent 代表不同用户执行任务时(比如 AWS Bedrock AgentCore 的场景 (来源: AWS Machine Learning Blog, 2026-03-12)),需要硬件级别的安全隔离来防止 Agent 之间的数据泄露。
Arm AGI CPU 的设计正是针对这些特征。它采用了 Arm 最新的 V3 架构,但在以下方面做了专门优化:
- 大容量 L3 缓存(据传超过256MB),用于存储 Agent 的长上下文状态
- 硬件级 Agent 沙箱,通过 Arm CCA(Confidential Compute Architecture)实现 Agent 之间的隔离
- 高带宽 CPU-GPU 互联,通过 NVLink-C2C 实现 CPU 和 GPU 之间的统一内存访问,减少 Agent 在异构计算切换时的数据搬运开销
- 专用的调度引擎,能够根据 Agent 工作负载的实时特征动态分配计算资源
3.2 这对数据中心意味着什么
Arm AGI CPU 的战略意义远超一颗处理器。它标志着 NVIDIA 正在从”GPU 公司”向”数据中心计算平台公司”的转型中迈出关键一步。
目前,NVIDIA 在数据中心的收入主要来自 GPU(H100/H200/B100/B200 系列)。CPU 市场一直被 Intel 和 AMD 主导。但如果 Agent 工作负载真的如 Jensen 所预测的那样成为数据中心的主要工作负载,那么传统的 x86 CPU 将面临结构性劣势——它们不是为 Agent 的异构、交互式、状态密集型计算模式设计的。
NVIDIA 的策略是:用 Arm AGI CPU + NVIDIA GPU + NVLink 互联 + NVIDIA 软件栈,提供一个完整的、针对 Agent 优化的计算单元。这就像 Apple 用 M 系列芯片统一了 CPU 和 GPU,但 NVIDIA 是在数据中心层面做同样的事。
对 Intel 和 AMD 来说,这是一个存在性威胁。如果 NVIDIA 成功地将 Agent 工作负载定义为数据中心的主流,并且 Arm AGI CPU 成为这类工作负载的最优选择,那么 x86 在数据中心的份额将面临前所未有的侵蚀。Intel 刚刚在2025年经历了痛苦的重组,AMD 虽然在 AI GPU 市场有所斩获但份额仍然有限——它们都还没有针对 Agent 工作负载的专门CPU 产品。
3.3 对立视角:Arm AGI CPU 可能面临的挑战
当然,这个愿景也面临重大挑战。
首先是生态系统惯性。数据中心的软件栈已经围绕 x86 架构优化了数十年。迁移到 Arm 架构意味着重新编译、重新优化、重新验证大量的中间件和应用程序。AWS 的 Graviton 系列已经证明 Arm 在云计算中是可行的,但 Graviton 花了超过5年时间才达到 AWS 内部约30% 的实例份额。
其次是竞争对手的反应。AMD 的 EPYC 系列已经在与 NVIDIA GPU 的协同工作上投入了大量工程资源,而且 AMD 同时拥有 CPU 和 GPU 产品线的优势不容忽视。Intel 的 Gaudi 3 AI 加速器虽然市场反响平平,但 Intel 在 CPU 市场的渠道和客户关系仍然深厚。
我的判断是:Arm AGI CPU 在3年内不会取代 x86 成为数据中心的主流 CPU,但它会在 Agent 工作负载这个快速增长的细分市场中建立主导地位。 这就足够了——因为如果 Agent 工作负载的增速真的如 NVIDIA 所预测的那样(年增长超过200%),那么即使只占数据中心整体 CPU 市场的15%-20%,也意味着数百亿美元的年收入。
四、Nemotron 3 Super:Agent 推理的经济学
4.1 5倍吞吐量提升意味着什么
NVIDIA 在 GTC 2026 上发布的 Nemotron 3 Super 是一个专为 Agentic AI 优化的推理模型 (来源: NVIDIA Blog, 2026-03-11)。”5倍吞吐量提升”这个数字听起来像是常规的代际改进,但在 Agent 场景下,它的含义远比表面更深。
Agent 推理的成本结构与普通 LLM 推理完全不同。一次普通的 ChatGPT 对话可能涉及1-3次模型调用。而一个 Agent 完成一个中等复杂度的任务(比如”帮我研究这5家公司的财务数据并生成对比报告”),可能涉及 20-50次模型调用——包括任务分解、工具选择、API 调用、结果解析、错误处理和最终综合。
这意味着 Agent 的推理成本是普通 LLM 交互的10-50倍。在当前的推理定价下(以 GPT-4o 为例,输入 $2.5/百万 token,输出 $10/百万 token),一个 Agent 完成一个复杂任务的成本可能在 $0.5-$5 之间。对于企业级应用来说,如果每天有数万次 Agent 调用,成本会迅速变得不可接受。
Nemotron 3 Super 的5倍吞吐量提升,直接将 Agent 的单次推理成本降低了约80%。这不是一个渐进式改进——它可能是将 Agent 从”demo 级产品”推向”生产级部署”的关键经济门槛。
4.2 NVIDIA 的推理经济学飞轮
这里有一个大多数人没看到的飞轮效应:
- Nemotron 3 Super 降低了 Agent 推理成本
- 更低的成本使更多企业能够部署 Agent(参考 Salesforce Agentforce 的快速扩张 (来源: Salesforce News, 2026-03-10))
- 更多的 Agent 部署产生更多的推理需求
- 更多的推理需求推动更多 NVIDIA GPU 的采购
- 更多的 GPU 部署为 NVIDIA 提供更多数据来优化下一代推理模型
- 回到第1步
这个飞轮的关键在于:NVIDIA 同时控制了硬件(GPU)和软件(Nemotron),所以它可以在两个层面同时优化——这是 AMD、Intel 甚至 Google(TPU + Gemini)都难以复制的优势,因为没有其他公司同时拥有市场领先的 AI 加速硬件和具有竞争力的推理模型。
4.3 Nemotron 的真正竞争对手不是 GPT
一个常见的误解是把 Nemotron 与 GPT-5 或 Claude 4 放在同一个竞争维度上比较。这是错误的。Nemotron 3 Super 的定位不是”最聪明的模型”,而是”在 NVIDIA 硬件上运行最高效的 Agent 推理模型”。
它的真正竞争对手是:
- Meta 的 Llama 4 系列(开源,可在任何硬件上运行)
- Google 的 Gemma 3(针对 TPU 优化)
- Mistral 的 Mistral Large 3(欧洲开源替代方案)
NVIDIA 的策略是:你可以用任何模型,但如果你用 Nemotron + NVIDIA GPU,你会获得最佳的性价比。这就像 Apple 的 Metal 图形 API——你可以用 OpenGL,但在 Apple 硬件上 Metal 就是更快。
五、Agent 基础设施的生态爆发:从 AgentMail 到 Agentic Commerce
5.1 Agent 需要自己的基础设施层
GTC 2026 的 Agent 叙事不是 NVIDIA 一家的独角戏。整个行业正在围绕 Agent 构建一个全新的基础设施层,而这些基础设施的出现本身就是 Agent 时代到来的最强信号。
AgentMail 在2026年3月完成了由 General Catalyst 领投的600万美元种子轮融资 (来源: TechCrunch, 2026-03-10)。这家公司做的事情听起来几乎荒谬——为 AI Agent 提供专属邮箱。但仔细想想,这揭示了一个深刻的基础设施缺口:当 Agent 需要代表用户与其他系统或人类进行异步通信时,它需要一个身份和通信渠道。现有的邮件系统是为人类设计的——它们有验证码、有图片识别、有各种反机器人机制。Agent 需要自己的通信基础设施。
Lemrock 在巴黎完成了600万欧元融资,构建 AI Agent 的商务交易基础设施 (来源: The Next Web, 2026-03-11)。当一个 Agent 需要代表用户购买商品或订阅服务时,它需要支付能力、合同签署能力和退款处理能力。这些都是人类世界的商业流程,现在需要被重新设计以适应 Agent 的操作模式。
Dify 完成了3000万美元 Pre-A 轮融资,专注企业级 Agentic 工作流编排 (来源: Yahoo Finance, 2026-03-09)。这是 Agent 基础设施中的”中间件”层——帮助企业将多个 Agent 组合成复杂的工作流,并管理它们之间的协作和冲突。
5.2 AWS 和 Salesforce 的 Agent 治理竞赛
如果说初创公司在构建 Agent 的”管道”,那么云巨头们正在构建 Agent 的”治理框架”。
AWS 在2026年3月密集发布了 Agent 相关的更新:Bedrock AgentCore 的策略安全功能 (来源: AWS Machine Learning Blog, 2026-03-12) 和 Agentic AI 运营化指南 (来源: AWS Machine Learning Blog, 2026-03-11)。这些不是技术突破——它们是企业采用 Agent 的前提条件。没有一个 CISO 会批准部署一个无法控制权限边界的 Agent 系统。AWS 的策略层安全控制允许企业定义”这个 Agent 可以读取哪些数据库、可以调用哪些 API、可以花费多少预算”,这是 Agent 从实验室走向生产环境的关键一步。
Salesforce 的动作更加激进。在同一周内,Salesforce 发布了 Agentforce Contact Center (来源: Salesforce News, 2026-03-10)、Agentforce 360 for Small Business (来源: Salesforce Blog, 2026-03-09),并宣布重构 Marketing Cloud 以原生支持 Agent 能力 (来源: Salesforce Ben, 2026-03-09)。Marc Benioff 显然在押注 Agent 将成为 Salesforce 的下一个增长引擎——如果每个企业都需要 Agent 来处理客户服务、销售和营销,那么 CRM 平台就是 Agent 的天然宿主。
Salesforce 开发者博客上的一篇文章尤其值得关注:它探讨了在 Agentic AI 时代开发者角色的转变——”从编写代码到编排 Agent 和定义策略” (来源: Salesforce Developers Blog, 2026-03-10)。这不是一个抽象的讨论,这是对整个软件开发行业的重新定义。如果开发者的工作从”写代码”变成”设计 Agent 的行为策略”,那么编程语言、IDE、CI/CD 工具都需要重新设计。
5.3 Amazon 的 Agent 实验:医疗健康的试金石
Amazon 在主站和 App 推出的 Health AI Agent (来源: Amazon News, 2026-03-10) 是一个特别值得关注的案例。这不是因为它的技术有多先进,而是因为它选择了医疗健康这个高风险、高监管的领域作为 Agent 的落地场景。
为 Prime 会员提供免费7×24虚拟医疗咨询,与 One Medical 整合——这意味着 Amazon 的 Agent 将直接处理涉及用户生命健康的决策。如果这个 Agent 出了错(比如误判症状、延误就医),后果远比一个购物推荐 Agent 严重得多。
Amazon 之所以敢这么做,有两个原因:第1,One Medical 的医生团队提供了人类监督的安全网;第2,Amazon 拥有的用户健康数据(通过 Halo 设备、Amazon Pharmacy 和 One Medical)为 Agent 提供了丰富的上下文信息。
但这也揭示了 Agent 时代的一个核心矛盾:Agent 越有用,它需要访问的数据越敏感;数据越敏感,Agent 出错的后果越严重。 这个矛盾在医疗、金融和法律领域尤为突出,也是 AWS Bedrock AgentCore 策略安全功能存在的根本原因。
六、被忽略的第3层洞察:NVIDIA 正在成为 Agent 时代的”税务局”
6.1 全栈控制的经济学
现在让我们把所有拼图放在一起。
NVIDIA 在 GTC 2026 上展示的不是一系列独立的产品,而是一个精心设计的价值捕获系统:
- Isaac Lab 3.0 确保机器人 Agent 的训练在 NVIDIA 平台上进行 → 训练计算收入
- GR00T 确保机器人 Agent 的”大脑”是 NVIDIA 提供的 → 模型许可/服务收入
- Nemotron 3 Super 确保 Agent 推理在 NVIDIA GPU 上最高效 → 推理计算收入
- Arm AGI CPU 确保 Agent 的 CPU 工作负载也在 NVIDIA 生态内 → CPU 芯片收入
- NIM 微服务 确保 Agent 的部署和管理通过 NVIDIA 平台 → 平台服务收入
这5个层面覆盖了 Agent 从训练到部署到运行的整个生命周期。每一个层面,NVIDIA 都在收取”Agent 税”。
让我做一个粗略的经济模型:
假设到2028年,全球有100万个企业部署了 Agent 系统(考虑到 Salesforce 一家就有超过15万企业客户,这个数字并不激进)。每个企业平均每年在 Agent 基础设施上花费10万美元(包括 GPU 租赁、模型服务、平台费用)。那么 Agent 基础设施的年市场规模就是 1000亿美元。
如果 NVIDIA 能够捕获其中的30%-40%(通过 GPU 销售、Nemotron 推理服务和平台费用),那就是每年 300-400亿美元 的增量收入。这几乎相当于 NVIDIA 2024财年全年数据中心收入的翻倍。
6.2 Microsoft 的 Frontier Suite:NVIDIA 最大的客户也是最大的潜在竞争者
Microsoft 在2026年3月9日发布的 Frontier Suite (来源: Microsoft 365 Blog, 2026-03-09) 值得特别关注。这个基于”Intelligence + Trust”构建的产品套件全面整合了 Copilot 和 AI Agent 能力,标志着 Microsoft 在企业 Agent 市场的全面进攻。
Microsoft 是 NVIDIA 最大的 GPU 客户之一——Azure 上运行着数十万块 NVIDIA GPU。但 Microsoft 也在积极开发自己的 AI 芯片(Maia 100)和推理优化技术。如果 Microsoft 的自研芯片在 Agent 工作负载上达到 NVIDIA GPU 80% 的性能,但成本只有50%,那么 Microsoft 完全有动机将 Copilot 和 Agent 工作负载迁移到自研芯片上。
这是 NVIDIA “Agent 税”模型的最大风险:你最大的客户同时也是你最有能力的潜在竞争者。 Google(TPU)、Amazon(Trainium/Inferentia)和 Microsoft(Maia)都在走这条路。
NVIDIA 的应对策略就是我们在 GTC 2026 上看到的:通过全栈整合创造转换成本。 如果你用 Isaac Lab 训练、用 GR00T 作为基础模型、用 Nemotron 做推理、用 Arm AGI CPU 做调度、用 NIM 做部署——那么你迁移到其他平台的成本将极其高昂。这就是 CUDA 锁定效应的 Agent 时代升级版。
6.3 最深层的洞察:Jensen 不是在卖 GPU,他是在卖”Agent 时代的 Windows”
回到文章开头的问题:Jensen 宣布 AGI 已到来,这到底意味着什么?
表面上,这是一个关于 AI 能力的技术判断。 深一层,这是一个关于市场定位的商业策略。 最深层,这是 NVIDIA 从硬件公司向平台公司转型的宣言。
在 PC 时代,真正赚钱的不是造电脑的 Dell 和 HP,而是提供操作系统的 Microsoft。在移动时代,真正赚钱的不是造手机的富士康,而是提供平台的 Apple 和 Google。
Jensen 的赌注是:在 Agent 时代,真正赚钱的不是训练模型的 OpenAI 和 Anthropic(它们是”应用开发者”),也不是部署 Agent 的企业(它们是”用户”),而是提供 Agent 运行所需的全栈基础设施的 NVIDIA(它是”操作系统”)。
GR00T 是 Agent 的”内核”,Isaac Lab 是”开发工具”,Nemotron 是”运行时”,Arm AGI CPU 是”硬件抽象层”,NIM 是”API 框架”。把这些放在一起,你得到的不是一堆产品——你得到的是 Agent 时代的 Windows。
七、So What:这对你意味着什么
如果你是 AI 创业者:NVIDIA 的全栈策略意味着你需要非常清楚自己在 Agent 价值链中的位置。如果你的产品可以被 NVIDIA 的某个层面替代(比如你在做 Agent 编排,而 NIM 也能做),你需要找到差异化的护城河。AgentMail 和 Lemrock 的策略值得学习——它们选择了 NVIDIA 不太可能进入的垂直基础设施层。
如果你是 企业 CTO:Agent 部署的窗口正在打开,但锁定风险也在增加。AWS Bedrock AgentCore 的策略安全功能和 Salesforce Agentforce 的快速迭代表明,企业级 Agent 的治理框架正在成熟。现在是评估 Agent 部署策略的时候,但要警惕过早绑定单一供应商。
如果你是 投资者:NVIDIA 的 Agent 叙事将推动一波新的基础设施投资浪潮。关注3个方向:(1) Agent 专用基础设施(通信、支付、身份);(2) Agent 治理和安全工具;(3) 垂直领域的 Agent 应用(医疗、法律、金融)。Physical Intelligence 的10亿美元融资只是开始。
如果你是 NVIDIA 的竞争对手:你需要在 Agent 基础设施的某个层面建立不可替代的优势,否则你将被挤压到纯硬件的商品化竞争中。AMD 应该加速其 Agent 软件栈的开发,Intel 应该考虑收购一家 Agent 编排平台公司,Google 应该将 Gemini 的 Agent 能力与 GCP 更紧密地整合。
Jensen Huang 说 AGI 已到来。也许他是对的,也许他不是。但有一件事是确定的:他已经成功地让整个行业按照他的定义来讨论这个问题。 在科技行业,控制定义的人,控制未来。
参考资料
- Nemotron 3 Super Agentic AI — NVIDIA Blog, 2026-03-11
- Powering Frontier Transformation with Copilot and Agents — Microsoft 365 Blog, 2026-03-09
- AgentMail Raises $6M to Build an Email Service for AI Agents — TechCrunch, 2026-03-10
- Secure AI Agents with Policy in Amazon Bedrock AgentCore — AWS Machine Learning Blog, 2026-03-12
- Operationalizing Agentic AI Part 1: A Stakeholder’s Guide — AWS Machine Learning Blog, 2026-03-11
- Agentforce Contact Center Announcement — Salesforce News, 2026-03-10
- Dify Raises $30 Million Series Pre-A — Yahoo Finance, 2026-03-09
- Lemrock Raises €6M for Agentic Commerce — The Next Web, 2026-03-11
- 10 Years of AlphaGo — Google DeepMind, 2026-03-10
- The Future of the Salesforce Developer in the Agentic AI Era — Salesforce Developers Blog, 2026-03-10
- Amazon Health AI Agent with One Medical — Amazon News, 2026-03-10
- How Salesforce Is Rebuilding Marketing Cloud for the Age of AI — Salesforce Ben, 2026-03-09
主题分类:openclaw