当「点击」变成「询问」:Nvidia RTX Spark与PC四十年最大范式转移

2026年6月1日,台北南港展览馆,黄仁勋走上Computex的主舞台,说出了这句话:

“四十年来,你点击应用程序。Click。Type。现在,有了RTX Spark和微软Windows,你来问——PC来干活。”

这不是一句营销口号。这是一个技术范式的宣告:个人电脑,从工具,变成了队友。

一块芯片的革命性配方

RTX Spark是什么?

字面上,它是一款超级芯片(Superchip)。但”超级”在这里有极精确的含义:

它把过去30年Nvidia积累的每一项技术,压缩进了一颗可以装进笔记本的芯片里。

具体的技术配方是:

  • Blackwell RTX GPU:6,144个CUDA核心,第五代Tensor Core,支持FP4精度运算——这是Nvidia当前最先进数据中心GPU架构的直系后代,同样的计算内核此前只出现在价值数万美元的数据中心加速卡上
  • Grace CPU(N1X):20核ARM架构处理器,与MediaTek联合设计——这是Nvidia在消费级CPU市场的首次正式亮相,距Nvidia上一次认真涉足PC处理器已超过10年。MediaTek作为全球最大的ARM SoC设计商,负责贡献其在超低功耗ARM设计上的积累
  • NVLink-C2C互联:GPU与CPU之间的高带宽片间直连,理论带宽远超传统PCIe总线。这是Nvidia最早用于Grace Hopper数据中心产品的技术——现在下放到消费级,是RTX Spark避免传统异构架构内存带宽瓶颈的关键
  • 128GB统一内存(Unified Memory):GPU与CPU共享同一内存池,消除了AI工作负载中反复的”内存搬运”——在大语言模型推理场景,这意味着完整装下一个1200亿参数的模型成为可能,而不需要分片或量化到模型能力显著下降的程度
  • 1 PFLOPS AI计算力:即1000万亿次浮点运算/秒,这是AI Agent在本地流畅运行的算力门槛

这些数字放在几年前的数据中心语境下,任何一项都属于旗舰级别。现在,Nvidia把它们全部装进了一台”全天续航的轻薄笔记本”。

为什么120亿参数是一条分水岭——而1200亿才是终点

在大语言模型家族里,1200亿参数是一个具有特殊意义的节点。

主流的”本地AI”方案长期被局限在70亿到80亿参数量级——Llama 3.1 8B、Mistral 7B、Qwen 7B——这个量级的模型可以流畅地在8GB显存的消费级GPU上运行,但其能力与顶级云端模型之间存在接近一个数量级的差距。120亿参数的模型(如Llama 3.1 70B的量化版本,或Qwen 72B)开始展现出接近GPT-4 Turbo的多步推理能力,但受制于显存,此前只能运行在专业工作站或小型服务器上。

RTX Spark的128GB统一内存,第一次让消费级移动设备可以无限制地运行1200亿参数的模型——不需要量化,不需要分片,不需要妥协。

更重要的是1百万token的上下文窗口。1百万token大约可以容纳:

  • 750本普通长度的书(或一个公司的完整知识库)
  • 一个中型代码库的全部源代码(约100万行)
  • 数年的邮件往来记录和工作文档

当一个AI Agent可以在本地”记住”并随时检索这些内容,在完全不联网的情况下处理复杂工作流,个人数据隐私的保护从根本上得到解决——因为数据根本不需要离开本地。

这是RTX Spark最深层的战略意义:它把云端大模型能力的完整表达,带到了用户的桌面上,同时斩断了数据上传的必要性。

四十年的PC范式,在这一刻翻页

要理解RTX Spark意味着什么,需要理解PC行业到底有多长时间没有真正改变。

1984年,苹果Macintosh把图形用户界面(GUI)带给大众,让”点击”成为人机交互的基本范式。鼠标指向,单击,双击,拖拽——这套逻辑统治了PC世界整整40年,历经DOS到Windows 11,从CRT显示器到4K OLED屏幕,从软盘到PCIe固态硬盘,触控操作普及了,语音助手出现了,但本质的交互逻辑没有变。你是主动操作者,PC是执行工具。

2020年代前半段,生成式AI出现了,但第一波AI PC的叙事是混乱和失望的。

Intel的”AI PC”认证标准要求了一个数字(NPU达到TOPS数值),但这个数字在实际任务中几乎没有意义——TOPS是一个在特定精度下才有可比性的指标,很多厂商通过低精度运算虚高数字。高通Snapdragon X平台的Copilot+PC是一次有诚意的尝试,但受制于模型能力和Windows生态的不完整,”本地AI”的体验更像是一个演示demo而非可用的生产力工具。市面上销售的”AI PC”,其所谓AI功能大多数不过是把云端API封装成本地快捷键——本质上仍依赖网络连接和云端计算。

RTX Spark不同的地方在于:它是第一款从一开始就为”Agent原生”(Agent-Native)设计的个人计算平台。

黄仁勋在发布会上使用的词是”personal AI computer”,刻意区别于”AI PC”。差别在于:

  • AI PC:在传统PC上增加AI功能,用户还是主动操作者,AI是辅助工具
  • Personal AI Computer:PC主动代表用户规划和执行任务,用户成为需求提出者,PC是代理人

这是从”工具”到”代理人”的根本性转变。认知科学把这种转变称为认知外包(cognitive offloading)的升级——从外包单一查询(搜索引擎)、单一计算(导航),到外包整个工作流程(Agent)。区别在于,之前的认知外包只能处理原子化任务,而在RTX Spark平台上运行的Agent,第一次让本地PC具备了处理”多步推理+跨应用协调+长期记忆”这类复合任务的能力。

发布会上,Nvidia引用了一个有意思的数据点:开发者平台GitHub和OpenRouter上,开源Agent项目(如Hermes Agent)正在创下历史最高的增长速度。Agent开发者有,算力需求有,用户意愿有——缺少的是一个足够强大且足够私密的本地运行平台。RTX Spark是对这个缺口的正面回应。

微软的角色:安全基础设施是这次合作的真正核心

Nvidia独自可以解决硬件层面的问题,但要让AI Agent真正在Windows生态里落地运行,需要微软从操作系统层面重新设计Agent的安全框架。

这次合作的核心不是某个特定功能,而是两层安全基础设施的联合构建

第一层:Windows原生安全原语(Native Security Primitives)

微软为Agent场景新开发了一套基础安全能力框架,包含4个核心组件:

身份验证(Identity):明确Agent代表谁在行动,以及其权限边界。当Agent替你发一封邮件或者转一笔账,系统需要知道这是”用户授权的Agent行动”而非”未经授权的第三方访问”——这要求身份框架同时能区分”用户在操作”和”用户授权的Agent在操作”。

隔离容器(Containment):Agent的行动被严格限制在用户定义的沙箱内。一个负责管理日历的Agent,不应该有权限读取你的财务文件;一个负责写代码的Agent,不应该有权限访问你的联系人列表。Windows的容器机制确保Agent的权限边界在系统层面强制执行,而不依赖Agent本身的”诚实度”。

策略执行(Policy Enforcement):用户可以以细粒度定义每个Agent的操作规则——”这个Agent可以读取本地文件夹A,但不能上传任何内容”,”这个Agent可以代表我发推文,但每条内容需要我确认”。策略在内核层级执行,不可被Agent绕过。

端到端审计(Audit Trail):每一步Agent操作都有完整的可追溯日志,用户可以随时查看”Agent帮我做了什么”,也可以选择回滚任何特定操作。这是企业合规和个人信任建立的基础。

微软CEO Satya Nadella给这个系统的定位是未来所有Windows Agent应用的”宪法基础”——它的意义类似于1990年代TCP/IP协议栈对互联网应用的意义:不是某一个应用的功能,而是所有应用赖以构建的基础设施层。

第二层:NVIDIA OpenShell运行时

OpenShell是Nvidia的配套安全层,与Windows安全原语协同工作,提供三项独特能力:

策略引擎(Policy Engine):用户用自然语言定义Agent的操作范围,OpenShell将其转化为机器可执行的安全策略——”我的健康数据不能离开这台电脑”这样的描述,会被转化成明确的访问控制规则。

智能路由(Intelligent Routing):并非所有任务都需要发往云端,也并非所有任务都能在本地高效完成。OpenShell根据用户的隐私策略和任务复杂度,动态决定哪些查询发往本地模型处理,哪些可以发往云端——并在发往云端之前执行信息脱敏。

信息遮蔽(Personal Information Masking):在必须调用云端服务的查询中,自动识别和替换个人识别信息(姓名、地址、账号、医疗信息等),发送经过脱敏的查询,收到回复后再将结果还原,用户全程感知不到这个过程的存在。

两层安全架构合在一起,解决了AI Agent本地化部署的核心悖论:用户想要Agent代表自己行动,但又无法完全信任Agent。 Windows安全原语解决了”Agent做了什么”的可见性问题,OpenShell解决了”Agent说了什么”的隐私问题。

Satya Nadella在发布会上给出了这次合作的战略定义:“我们的目标是给每个家庭和每张桌子带来无限量的智能。RTX Spark是迈向这个愿景的真正突破。”

“无限量的智能”这个表达里有一个重要的经济模型转变:这不是云端按调用次数或按时计费的智能,而是一次性购买的、永久在本地运行的、不依赖网络连接的计算能力。这是互联网时代以来,”智能”的分发模式第一次从”订阅/消费”转向”拥有/资产”。

Adobe的重新架构:一个市场信号的精准解读

Adobe是这次发布中最值得单独讨论的合作伙伴。

公告的具体内容是:Adobe正在从头开始为RTX Spark重构Photoshop和Premiere,目标是AI和图形性能较当前版本提升2倍。

“从头重构”在大型软件公司的字典里是一个极为罕见的词汇。Photoshop诞生于1988年,代码库中有数以百万计行的历史积累;Premiere的渲染引擎可以追溯到Adobe收购它的1991年。这类历史遗产系统,通常只有在两种情况下才会被彻底重写:平台已经死亡不得不迁移,或者新平台的机遇大到让重写成本显得微不足道。

Adobe选择为RTX Spark重构,说明他们对两件事有坚定判断:

第一,RTX Spark的架构特性(FP4精度+第五代Tensor Core+NVLink-C2C统一内存)与创意AI工作负载之间,存在足够深的协同潜力,以至于传统的”在CPU上调度CUDA核心”架构已无法充分发挥新芯片的潜力。 要拿到那2倍性能,必须从底层重写。

第二,”本地AI创意工作站”市场足够大,值得Adobe把整个主力产品线的未来押注在这个方向上。 这意味着Adobe判断:专业创作者对”本地处理、不上传云端”的需求是真实的、持续的、愿意为之付费的。

这个判断如果成立,它对Adobe的商业模式会有深远影响。Adobe Firefly当前的核心商业逻辑是云端AI生成——用户使用Creative Cloud,调用Adobe服务器上的Firefly模型处理图像。如果高质量的AI创意工作可以在本地完成,Adobe的云端溢价就会面临侵蚀。Adobe选择”自我颠覆”而不是等待竞争对手来颠覆,这本身是一个战略成熟度的表现。

除Adobe外,还有超过100家Windows软件合作伙伴和1000+款游戏宣布支持RTX Spark平台,包括Blackmagic Design(专业视频)、Blender(3D创作)、KRAFTON、Riot Games等。当生态密度达到这个量级,它就不再是”兼容模式”——它成为新的默认标准。

从软件到硅片:TSMC合作揭示的产业闭环

Computex这一天,Nvidia还宣布了另一个容易被硬件发布光芒遮盖的重要消息:台积电(TSMC)正在全面采用Nvidia的AI工具加速芯片制造流程。而台积电,正是生产RTX Spark的工厂——这意味着这场合作既是商业协议,也是一个自我强化的闭环系统。

这个合作的技术细节值得仔细看:

计算光刻(cuLitho):芯片制造中,光刻(Lithography)是把芯片设计”印”到硅片上的关键步骤,也是最计算密集的步骤之一。TSMC使用Nvidia的cuLitho GPU加速库,使光刻仿真的成本效益或周期时间提升了20-50%。光刻仿真越快,新工艺节点的开发周期就越短。

晶体管模拟(cuEST):先进制程中的晶体管行为需要量子力学级别的精确模拟。Nvidia的cuEST工具使这类化学仿真平均加速50倍。这让TSMC的工艺工程师可以在同样时间内测试50倍多的工艺参数组合,加速新材料和新工艺的发现。

先进制程控制(cuML):芯片制造过程中有数千个工艺参数需要实时监控和调整。TSMC使用Nvidia的机器学习库cuML处理大规模工艺参数分析,将原本需要数小时的计算压缩到分钟级,使实时工艺控制成为可能,显著减少工艺变异。

纳米级缺陷检测(Metropolis+TAO):在3nm及以下工艺节点,一个纳米级的缺陷可能导致整个芯片失效。TSMC使用Nvidia视觉AI工具实现自动化缺陷检测,减少反复标注和重训练的工作量。

理解这个合作的关键不在于技术细节,而在于它揭示的产业闭环逻辑

Nvidia AI工具加速TSMC生产效率 → TSMC产能提升,成本降低 → Nvidia芯片(包括RTX Spark)的生产成本和供货周期改善 → RTX Spark更快、更多地进入市场 → 更多开发者为RTX Spark生态投入 → 软件生态强化使RTX Spark平台价值提升 → Nvidia营收增长使其有更多资源研发更好的AI工具……

这是一个精妙的飞轮结构。在这个结构中,Nvidia不是单纯的芯片销售商,而是整个半导体产业链AI化转型的工具提供商——提供工具,赚取工具带来的产能红利,再用产能红利强化自身的市场地位。

物理AI的开源基础设施:下一个边界已开放

除RTX Spark之外,Nvidia当天还发布了面向物理AI(Physical AI)的开源Agent工具集——一个目标群体完全不同,但战略意义同样深远的公告。

物理AI指的是能够在真实世界中感知、决策和行动的AI系统:机器人、自动驾驶汽车、工业检测系统、智慧工厂数字孪生。这些系统的开发长期以来极度依赖专业工程师手动编写协调代码——把数据采集、模型训练、仿真验证、部署上线这些步骤串联起来,需要数月的工程投入。

Nvidia发布的Agent工具集覆盖了Omniverse、Cosmos、Alpamayo和Metropolis四个平台,核心做了一件事:把之前需要人类工程师手动编写的复杂工作流,封装成了AI Agent可以直接调用的标准化”技能”(Skills)。

举一个具体例子:训练一个工业机器人的抓取模型,传统流程需要:

  1. 工程师手动配置Omniverse仿真环境参数
  2. 运行仿真生成训练数据(数千小时的虚拟操作场景)
  3. 调用Isaac训练流水线
  4. 在真实机器人上验证,收集失败案例
  5. 返回步骤2迭代

这个流程里的每一步都需要领域专家介入。有了Nvidia的Agent技能库,一个AI Agent可以被告知”训练一个能够抓取不规则形状物体的机器人抓取模型”,然后自主完成从仿真数据生成到模型训练到验证的全流程——工程师变成了监督者而不是执行者。

这是AI能力的递归式跃升:AI开始被用来加速AI的开发。物理AI工具集的开源,意味着这个能力不再是只有Nvidia能掌握的专有优势,而是被放入整个工业AI开发者社区。Foxconn、Siemens、Delta Electronics等工业巨头已经在使用这些工具——其背后的逻辑是,当物理AI开发成本大幅降低,Nvidia GPU和Nvidia软件平台的需求反而会爆发性增长。

这是Nvidia把开源作为市场扩张策略的典型案例——不是出于慈善,而是基于一个精确的商业判断:开放基础工具,扩大生态,让每一个物理AI应用都成为Nvidia算力的需求节点。

对立视角:理性审视这次革命的边界

任何范式转移都值得审视其阴暗面和实现条件。RTX Spark的发布同样如此。

第一个质疑:能耗与散热的物理约束。

1 PFLOPS的AI算力在数据中心语境下需要250-300W的功耗(以Nvidia H100为参考)。即使RTX Spark通过先进工艺(台积电3nm级别)和芯片整合将功耗大幅降低,”全天续航的轻薄笔记本”与”持续运行1200亿参数模型”之间仍然存在根本性的物理张力。截至发布时,Nvidia还没有公布RTX Spark的详细TDP(热设计功耗)数字。笔记本的散热约束通常在15-45W之间——在这个功耗预算下,1 PFLOPS能持续多久,是否需要频繁降频,这些问题的答案将决定”全天续航”和”1200亿参数本地运行”能否同时兑现。

第二个质疑:ARM架构迁移的生态摩擦。

RTX Spark的Grace CPU使用ARM架构,这意味着几十年积累的x86 Windows软件生态需要适配。苹果从Intel切换到M1的经验表明,这种迁移是可管理的——但苹果有Rosetta 2模拟层和对开发者生态的严格控制权。Nvidia在Windows生态中没有同等的控制力。100+合作伙伴宣布为RTX Spark重构的承诺,能转化成多快的现实,取决于Nvidia提供的工具链质量和开发者社区的积极性。主流企业应用(SAP、Oracle、AutoCAD)什么时候完成原生ARM适配,可能是RTX Spark商业落地速度的真正约束条件。

第三个质疑:Agent可信度依然是未解决的核心问题。

“PC来干活”的愿景建立在一个前提上:AI Agent足够可靠,可以被信任处理有后果的任务。但当前代AI Agent在处理复杂、多步骤、需要外部工具调用的任务时,失败率在不需要高精度的场景(写文章、生成图片)之外仍然显著高于可接受水平。

当一个Agent代替你完成银行转账、发出一封邮件、或者删除一批文件,一次失败的代价远高于传统”点击操作”——因为用户可能没有实时监督每一步。Windows安全原语和OpenShell解决了”能审计”和”能限权”的问题,但没有解决”Agent本身的可靠性”问题。RTX Spark提供了算力,但AI Agent的可信度仍然是生态真正落地的瓶颈。

洞察:PC行业的”M1时刻”,以及它的更大野心

2020年,苹果发布M1芯片时,很多人认为这只是”更快的Mac”。事后来看,M1是PC行业近20年来最重要的架构创新——它证明了ARM架构可以在性能不输x86的同时实现2倍以上的能效提升,并重新定义了”旗舰移动计算”的标准。

RTX Spark的位置,可能是PC行业的”第二个M1时刻”,但有三点根本性不同:

目标维度不同。 苹果M1解决的是”更快、更省电”的计算效率问题。RTX Spark解决的是”AI原生、Agent可用”的计算范式问题——不是让已有的事情做得更快,而是让之前不可能的事情变得可能。

生态覆盖范围不同。 苹果M1的目标用户是”已经在用Mac的人”——大约3亿活跃用户。RTX Spark的目标是”所有还在用传统PC工作流的人”——超过15亿的PC用户群体,加上工业AI、机器人、自动驾驶等非消费PC市场。

产业链整合深度不同。 苹果M1是苹果一家公司的芯片创新。RTX Spark背后是:Nvidia的GPU架构(Blackwell)、ARM的CPU生态(Grace+MediaTek)、微软的操作系统安全框架(Windows原生Agent原语)、台积电的制造工艺(配合cuLitho/cuEST优化)、100+软件合作伙伴的生态承诺。这不是一家公司的产品发布,这是一个产业联盟对新计算范式的集体押注。

更深层的洞察在于:Nvidia正在完成一次身份的再次转变。

第一次转变(2015-2020):从”GPU制造商”变成”AI算力提供商”——CUDA生态+数据中心GPU主导了这个转变。

第二次转变(2020-2025):从”AI算力提供商”变成”AI基础设施公司”——DGX系统、NVLink网络、Spectrum-X以太网主导了这个转变。

第三次转变(2026-?):从”AI基础设施公司”变成”个人AI时代的平台公司”——RTX Spark+OpenShell+Agent Toolkit是这个转变的起点宣言。

过去,Nvidia的客户是超大规模云服务商和企业数据中心。现在,Nvidia正在直接面向10亿量级的个人用户——通过他们每天使用的PC,通过他们每天运行的Agent,通过他们每天产生的数据。这是一次从B2B到B2C(通过B2B渠道)的战略扩张,是Nvidia市场天花板的又一次向上重写。

对竞争格局的影响同样值得深思。Intel花了十年试图守住x86架构在移动端的地位,最终被苹果M1用ARM替代了Mac;现在Nvidia同样用ARM进入PC市场,而且携带的不是”兼容方案”,是一个完整的AI Agent原生平台。AMD的移动端GPU(Radeon RX 9000M系列)在性能上可以与RTX系列竞争,但在AI算力架构(FP4+Tensor Core)和软件生态(CUDA+1000+应用)上的积累差距,短期内难以追平。苹果Apple Silicon在Mac端建立了坚实的AI PC先例,但苹果生态是封闭的——而RTX Spark+Windows组合面向的是80%+的全球PC市场,是苹果永远无法触达的那片土地。

黄仁勋今天在台北说的那句话,值得最后再看一遍:

“四十年来,你点击应用程序。Click。Type。现在,你来问——PC来干活。”

四十年的PC历史,正在以一块芯片为界,翻到新的一章。

一个还没有答案的问题:价格

发布会之后,最常被问到的问题是:RTX Spark究竟要多少钱?

Nvidia没有给出具体数字。ASUS、Dell、HP、Lenovo、Microsoft Surface和MSI的搭载RTX Spark的产品都将在今秋(2026年秋季)推出,具体定价由OEM厂商决定。

从已知信息推测价格区间:

  • RTX Spark的目标是替代当前旗舰游戏本和专业工作站笔记本市场
  • 当前同类配置(高端Blackwell移动GPU+大容量内存)的笔记本定价在2500-5000美元区间
  • ARM架构的RTX Spark理论上能效优于x86竞品,但首代产品通常有溢价

“让每个家庭和每张桌子都有无限量智能”——Satya Nadella的愿景如果要成为现实,RTX Spark的最终定价将是一个关键变量。一台3000-4000美元的”个人AI电脑”,仍然属于专业用户市场,而不是真正的大众消费品。真正的范式转移,需要等待第二代、第三代产品把成本降到主流消费者可以接受的水平。

这不会否定RTX Spark今天的历史意义——但它提醒我们区分两件事:技术可行性的宣告,和大众普及的时间线。前者发生在今天台北的发布台上,后者还需要时间。


参考资料

  1. NVIDIA官方新闻稿:NVIDIA and Microsoft Reinvent Windows PCs for the Age of Personal AI (2026-06-01) — nvidianews.nvidia.com
  2. NVIDIA官方新闻稿:NVIDIA Releases Major Collection of Open Source Agent Tools and Skills for Physical AI (2026-06-01) — nvidianews.nvidia.com
  3. NVIDIA官方新闻稿:NVIDIA and TSMC Bring AI Into Fabs to Advance Semiconductor Design and Manufacturing (2026-06-01) — nvidianews.nvidia.com
  4. Forbes: Nvidia Shows Off First Windows Laptops and Desktops Powered Entirely by Its Own Chip (2026-06-01) — forbes.com/siladityaray
  5. CNBC: Nvidia’s new chip to power fresh line of Windows laptops by Dell, HP (2026-06-01) — cnbc.com