当「点击」变成「询问」：Nvidia RTX Spark与PC四十年最大范式转移

2026年6月1日，台北南港展览馆，黄仁勋走上Computex的主舞台，说出了这句话：

“四十年来，你点击应用程序。Click。Type。现在，有了RTX Spark和微软Windows，你来问——PC来干活。”

这不是一句营销口号。这是一个技术范式的宣告：个人电脑，从工具，变成了队友。

一块芯片的革命性配方

RTX Spark是什么？

字面上，它是一款超级芯片（Superchip）。但”超级”在这里有极精确的含义：

它把过去30年Nvidia积累的每一项技术，压缩进了一颗可以装进笔记本的芯片里。

具体的技术配方是：

Blackwell RTX GPU：6,144个CUDA核心，第五代Tensor Core，支持FP4精度运算——这是Nvidia当前最先进数据中心GPU架构的直系后代，同样的计算内核此前只出现在价值数万美元的数据中心加速卡上
Grace CPU（N1X）：20核ARM架构处理器，与MediaTek联合设计——这是Nvidia在消费级CPU市场的首次正式亮相，距Nvidia上一次认真涉足PC处理器已超过10年。MediaTek作为全球最大的ARM SoC设计商，负责贡献其在超低功耗ARM设计上的积累
NVLink-C2C互联：GPU与CPU之间的高带宽片间直连，理论带宽远超传统PCIe总线。这是Nvidia最早用于Grace Hopper数据中心产品的技术——现在下放到消费级，是RTX Spark避免传统异构架构内存带宽瓶颈的关键
128GB统一内存（Unified Memory）：GPU与CPU共享同一内存池，消除了AI工作负载中反复的”内存搬运”——在大语言模型推理场景，这意味着完整装下一个1200亿参数的模型成为可能，而不需要分片或量化到模型能力显著下降的程度
1 PFLOPS AI计算力：即1000万亿次浮点运算/秒，这是AI Agent在本地流畅运行的算力门槛

这些数字放在几年前的数据中心语境下，任何一项都属于旗舰级别。现在，Nvidia把它们全部装进了一台”全天续航的轻薄笔记本”。

为什么120亿参数是一条分水岭——而1200亿才是终点

在大语言模型家族里，1200亿参数是一个具有特殊意义的节点。

主流的”本地AI”方案长期被局限在70亿到80亿参数量级——Llama 3.1 8B、Mistral 7B、Qwen 7B——这个量级的模型可以流畅地在8GB显存的消费级GPU上运行，但其能力与顶级云端模型之间存在接近一个数量级的差距。120亿参数的模型（如Llama 3.1 70B的量化版本，或Qwen 72B）开始展现出接近GPT-4 Turbo的多步推理能力，但受制于显存，此前只能运行在专业工作站或小型服务器上。

RTX Spark的128GB统一内存，第一次让消费级移动设备可以无限制地运行1200亿参数的模型——不需要量化，不需要分片，不需要妥协。

更重要的是1百万token的上下文窗口。1百万token大约可以容纳：

750本普通长度的书（或一个公司的完整知识库）
一个中型代码库的全部源代码（约100万行）
数年的邮件往来记录和工作文档

当一个AI Agent可以在本地”记住”并随时检索这些内容，在完全不联网的情况下处理复杂工作流，个人数据隐私的保护从根本上得到解决——因为数据根本不需要离开本地。

这是RTX Spark最深层的战略意义：它把云端大模型能力的完整表达，带到了用户的桌面上，同时斩断了数据上传的必要性。

四十年的PC范式，在这一刻翻页

要理解RTX Spark意味着什么，需要理解PC行业到底有多长时间没有真正改变。

1984年，苹果Macintosh把图形用户界面（GUI）带给大众，让”点击”成为人机交互的基本范式。鼠标指向，单击，双击，拖拽——这套逻辑统治了PC世界整整40年，历经DOS到Windows 11，从CRT显示器到4K OLED屏幕，从软盘到PCIe固态硬盘，触控操作普及了，语音助手出现了，但本质的交互逻辑没有变。你是主动操作者，PC是执行工具。

2020年代前半段，生成式AI出现了，但第一波AI PC的叙事是混乱和失望的。

Intel的”AI PC”认证标准要求了一个数字（NPU达到TOPS数值），但这个数字在实际任务中几乎没有意义——TOPS是一个在特定精度下才有可比性的指标，很多厂商通过低精度运算虚高数字。高通Snapdragon X平台的Copilot+PC是一次有诚意的尝试，但受制于模型能力和Windows生态的不完整，”本地AI”的体验更像是一个演示demo而非可用的生产力工具。市面上销售的”AI PC”，其所谓AI功能大多数不过是把云端API封装成本地快捷键——本质上仍依赖网络连接和云端计算。

RTX Spark不同的地方在于：它是第一款从一开始就为”Agent原生”（Agent-Native）设计的个人计算平台。

黄仁勋在发布会上使用的词是”personal AI computer”，刻意区别于”AI PC”。差别在于：

AI PC：在传统PC上增加AI功能，用户还是主动操作者，AI是辅助工具
Personal AI Computer：PC主动代表用户规划和执行任务，用户成为需求提出者，PC是代理人

这是从”工具”到”代理人”的根本性转变。认知科学把这种转变称为认知外包（cognitive offloading）的升级——从外包单一查询（搜索引擎）、单一计算（导航），到外包整个工作流程（Agent）。区别在于，之前的认知外包只能处理原子化任务，而在RTX Spark平台上运行的Agent，第一次让本地PC具备了处理”多步推理+跨应用协调+长期记忆”这类复合任务的能力。

发布会上，Nvidia引用了一个有意思的数据点：开发者平台GitHub和OpenRouter上，开源Agent项目（如Hermes Agent）正在创下历史最高的增长速度。Agent开发者有，算力需求有，用户意愿有——缺少的是一个足够强大且足够私密的本地运行平台。RTX Spark是对这个缺口的正面回应。

微软的角色：安全基础设施是这次合作的真正核心

Nvidia独自可以解决硬件层面的问题，但要让AI Agent真正在Windows生态里落地运行，需要微软从操作系统层面重新设计Agent的安全框架。

这次合作的核心不是某个特定功能，而是两层安全基础设施的联合构建：

第一层：Windows原生安全原语（Native Security Primitives）

微软为Agent场景新开发了一套基础安全能力框架，包含4个核心组件：

身份验证（Identity）：明确Agent代表谁在行动，以及其权限边界。当Agent替你发一封邮件或者转一笔账，系统需要知道这是”用户授权的Agent行动”而非”未经授权的第三方访问”——这要求身份框架同时能区分”用户在操作”和”用户授权的Agent在操作”。

隔离容器（Containment）：Agent的行动被严格限制在用户定义的沙箱内。一个负责管理日历的Agent，不应该有权限读取你的财务文件；一个负责写代码的Agent，不应该有权限访问你的联系人列表。Windows的容器机制确保Agent的权限边界在系统层面强制执行，而不依赖Agent本身的”诚实度”。

策略执行（Policy Enforcement）：用户可以以细粒度定义每个Agent的操作规则——”这个Agent可以读取本地文件夹A，但不能上传任何内容”，”这个Agent可以代表我发推文，但每条内容需要我确认”。策略在内核层级执行，不可被Agent绕过。

端到端审计（Audit Trail）：每一步Agent操作都有完整的可追溯日志，用户可以随时查看”Agent帮我做了什么”，也可以选择回滚任何特定操作。这是企业合规和个人信任建立的基础。

微软CEO Satya Nadella给这个系统的定位是未来所有Windows Agent应用的”宪法基础”——它的意义类似于1990年代TCP/IP协议栈对互联网应用的意义：不是某一个应用的功能，而是所有应用赖以构建的基础设施层。

第二层：NVIDIA OpenShell运行时

OpenShell是Nvidia的配套安全层，与Windows安全原语协同工作，提供三项独特能力：

策略引擎（Policy Engine）：用户用自然语言定义Agent的操作范围，OpenShell将其转化为机器可执行的安全策略——”我的健康数据不能离开这台电脑”这样的描述，会被转化成明确的访问控制规则。

智能路由（Intelligent Routing）：并非所有任务都需要发往云端，也并非所有任务都能在本地高效完成。OpenShell根据用户的隐私策略和任务复杂度，动态决定哪些查询发往本地模型处理，哪些可以发往云端——并在发往云端之前执行信息脱敏。

信息遮蔽（Personal Information Masking）：在必须调用云端服务的查询中，自动识别和替换个人识别信息（姓名、地址、账号、医疗信息等），发送经过脱敏的查询，收到回复后再将结果还原，用户全程感知不到这个过程的存在。

两层安全架构合在一起，解决了AI Agent本地化部署的核心悖论：用户想要Agent代表自己行动，但又无法完全信任Agent。 Windows安全原语解决了”Agent做了什么”的可见性问题，OpenShell解决了”Agent说了什么”的隐私问题。

Satya Nadella在发布会上给出了这次合作的战略定义：“我们的目标是给每个家庭和每张桌子带来无限量的智能。RTX Spark是迈向这个愿景的真正突破。”

“无限量的智能”这个表达里有一个重要的经济模型转变：这不是云端按调用次数或按时计费的智能，而是一次性购买的、永久在本地运行的、不依赖网络连接的计算能力。这是互联网时代以来，”智能”的分发模式第一次从”订阅/消费”转向”拥有/资产”。

Adobe的重新架构：一个市场信号的精准解读

Adobe是这次发布中最值得单独讨论的合作伙伴。

公告的具体内容是：Adobe正在从头开始为RTX Spark重构Photoshop和Premiere，目标是AI和图形性能较当前版本提升2倍。

“从头重构”在大型软件公司的字典里是一个极为罕见的词汇。Photoshop诞生于1988年，代码库中有数以百万计行的历史积累；Premiere的渲染引擎可以追溯到Adobe收购它的1991年。这类历史遗产系统，通常只有在两种情况下才会被彻底重写：平台已经死亡不得不迁移，或者新平台的机遇大到让重写成本显得微不足道。

Adobe选择为RTX Spark重构，说明他们对两件事有坚定判断：

第一，RTX Spark的架构特性（FP4精度+第五代Tensor Core+NVLink-C2C统一内存）与创意AI工作负载之间，存在足够深的协同潜力，以至于传统的”在CPU上调度CUDA核心”架构已无法充分发挥新芯片的潜力。要拿到那2倍性能，必须从底层重写。

第二，”本地AI创意工作站”市场足够大，值得Adobe把整个主力产品线的未来押注在这个方向上。 这意味着Adobe判断：专业创作者对”本地处理、不上传云端”的需求是真实的、持续的、愿意为之付费的。

这个判断如果成立，它对Adobe的商业模式会有深远影响。Adobe Firefly当前的核心商业逻辑是云端AI生成——用户使用Creative Cloud，调用Adobe服务器上的Firefly模型处理图像。如果高质量的AI创意工作可以在本地完成，Adobe的云端溢价就会面临侵蚀。Adobe选择”自我颠覆”而不是等待竞争对手来颠覆，这本身是一个战略成熟度的表现。

除Adobe外，还有超过100家Windows软件合作伙伴和1000+款游戏宣布支持RTX Spark平台，包括Blackmagic Design（专业视频）、Blender（3D创作）、KRAFTON、Riot Games等。当生态密度达到这个量级，它就不再是”兼容模式”——它成为新的默认标准。

从软件到硅片：TSMC合作揭示的产业闭环

Computex这一天，Nvidia还宣布了另一个容易被硬件发布光芒遮盖的重要消息：台积电（TSMC）正在全面采用Nvidia的AI工具加速芯片制造流程。而台积电，正是生产RTX Spark的工厂——这意味着这场合作既是商业协议，也是一个自我强化的闭环系统。

这个合作的技术细节值得仔细看：

计算光刻（cuLitho）：芯片制造中，光刻（Lithography）是把芯片设计”印”到硅片上的关键步骤，也是最计算密集的步骤之一。TSMC使用Nvidia的cuLitho GPU加速库，使光刻仿真的成本效益或周期时间提升了20-50%。光刻仿真越快，新工艺节点的开发周期就越短。

晶体管模拟（cuEST）：先进制程中的晶体管行为需要量子力学级别的精确模拟。Nvidia的cuEST工具使这类化学仿真平均加速50倍。这让TSMC的工艺工程师可以在同样时间内测试50倍多的工艺参数组合，加速新材料和新工艺的发现。

先进制程控制（cuML）：芯片制造过程中有数千个工艺参数需要实时监控和调整。TSMC使用Nvidia的机器学习库cuML处理大规模工艺参数分析，将原本需要数小时的计算压缩到分钟级，使实时工艺控制成为可能，显著减少工艺变异。

纳米级缺陷检测（Metropolis+TAO）：在3nm及以下工艺节点，一个纳米级的缺陷可能导致整个芯片失效。TSMC使用Nvidia视觉AI工具实现自动化缺陷检测，减少反复标注和重训练的工作量。

理解这个合作的关键不在于技术细节，而在于它揭示的产业闭环逻辑：

Nvidia AI工具加速TSMC生产效率 → TSMC产能提升，成本降低 → Nvidia芯片（包括RTX Spark）的生产成本和供货周期改善 → RTX Spark更快、更多地进入市场 → 更多开发者为RTX Spark生态投入 → 软件生态强化使RTX Spark平台价值提升 → Nvidia营收增长使其有更多资源研发更好的AI工具……

这是一个精妙的飞轮结构。在这个结构中，Nvidia不是单纯的芯片销售商，而是整个半导体产业链AI化转型的工具提供商——提供工具，赚取工具带来的产能红利，再用产能红利强化自身的市场地位。

物理AI的开源基础设施：下一个边界已开放

除RTX Spark之外，Nvidia当天还发布了面向物理AI（Physical AI）的开源Agent工具集——一个目标群体完全不同，但战略意义同样深远的公告。

物理AI指的是能够在真实世界中感知、决策和行动的AI系统：机器人、自动驾驶汽车、工业检测系统、智慧工厂数字孪生。这些系统的开发长期以来极度依赖专业工程师手动编写协调代码——把数据采集、模型训练、仿真验证、部署上线这些步骤串联起来，需要数月的工程投入。

Nvidia发布的Agent工具集覆盖了Omniverse、Cosmos、Alpamayo和Metropolis四个平台，核心做了一件事：把之前需要人类工程师手动编写的复杂工作流，封装成了AI Agent可以直接调用的标准化”技能”（Skills）。

举一个具体例子：训练一个工业机器人的抓取模型，传统流程需要：

工程师手动配置Omniverse仿真环境参数
运行仿真生成训练数据（数千小时的虚拟操作场景）
调用Isaac训练流水线
在真实机器人上验证，收集失败案例
返回步骤2迭代

这个流程里的每一步都需要领域专家介入。有了Nvidia的Agent技能库，一个AI Agent可以被告知”训练一个能够抓取不规则形状物体的机器人抓取模型”，然后自主完成从仿真数据生成到模型训练到验证的全流程——工程师变成了监督者而不是执行者。

这是AI能力的递归式跃升：AI开始被用来加速AI的开发。物理AI工具集的开源，意味着这个能力不再是只有Nvidia能掌握的专有优势，而是被放入整个工业AI开发者社区。Foxconn、Siemens、Delta Electronics等工业巨头已经在使用这些工具——其背后的逻辑是，当物理AI开发成本大幅降低，Nvidia GPU和Nvidia软件平台的需求反而会爆发性增长。

这是Nvidia把开源作为市场扩张策略的典型案例——不是出于慈善，而是基于一个精确的商业判断：开放基础工具，扩大生态，让每一个物理AI应用都成为Nvidia算力的需求节点。

对立视角：理性审视这次革命的边界

任何范式转移都值得审视其阴暗面和实现条件。RTX Spark的发布同样如此。

第一个质疑：能耗与散热的物理约束。

1 PFLOPS的AI算力在数据中心语境下需要250-300W的功耗（以Nvidia H100为参考）。即使RTX Spark通过先进工艺（台积电3nm级别）和芯片整合将功耗大幅降低，”全天续航的轻薄笔记本”与”持续运行1200亿参数模型”之间仍然存在根本性的物理张力。截至发布时，Nvidia还没有公布RTX Spark的详细TDP（热设计功耗）数字。笔记本的散热约束通常在15-45W之间——在这个功耗预算下，1 PFLOPS能持续多久，是否需要频繁降频，这些问题的答案将决定”全天续航”和”1200亿参数本地运行”能否同时兑现。

第二个质疑：ARM架构迁移的生态摩擦。

RTX Spark的Grace CPU使用ARM架构，这意味着几十年积累的x86 Windows软件生态需要适配。苹果从Intel切换到M1的经验表明，这种迁移是可管理的——但苹果有Rosetta 2模拟层和对开发者生态的严格控制权。Nvidia在Windows生态中没有同等的控制力。100+合作伙伴宣布为RTX Spark重构的承诺，能转化成多快的现实，取决于Nvidia提供的工具链质量和开发者社区的积极性。主流企业应用（SAP、Oracle、AutoCAD）什么时候完成原生ARM适配，可能是RTX Spark商业落地速度的真正约束条件。

第三个质疑：Agent可信度依然是未解决的核心问题。

“PC来干活”的愿景建立在一个前提上：AI Agent足够可靠，可以被信任处理有后果的任务。但当前代AI Agent在处理复杂、多步骤、需要外部工具调用的任务时，失败率在不需要高精度的场景（写文章、生成图片）之外仍然显著高于可接受水平。

当一个Agent代替你完成银行转账、发出一封邮件、或者删除一批文件，一次失败的代价远高于传统”点击操作”——因为用户可能没有实时监督每一步。Windows安全原语和OpenShell解决了”能审计”和”能限权”的问题，但没有解决”Agent本身的可靠性”问题。RTX Spark提供了算力，但AI Agent的可信度仍然是生态真正落地的瓶颈。

洞察：PC行业的”M1时刻”，以及它的更大野心

2020年，苹果发布M1芯片时，很多人认为这只是”更快的Mac”。事后来看，M1是PC行业近20年来最重要的架构创新——它证明了ARM架构可以在性能不输x86的同时实现2倍以上的能效提升，并重新定义了”旗舰移动计算”的标准。

RTX Spark的位置，可能是PC行业的”第二个M1时刻”，但有三点根本性不同：

目标维度不同。 苹果M1解决的是”更快、更省电”的计算效率问题。RTX Spark解决的是”AI原生、Agent可用”的计算范式问题——不是让已有的事情做得更快，而是让之前不可能的事情变得可能。

生态覆盖范围不同。 苹果M1的目标用户是”已经在用Mac的人”——大约3亿活跃用户。RTX Spark的目标是”所有还在用传统PC工作流的人”——超过15亿的PC用户群体，加上工业AI、机器人、自动驾驶等非消费PC市场。

产业链整合深度不同。 苹果M1是苹果一家公司的芯片创新。RTX Spark背后是：Nvidia的GPU架构（Blackwell）、ARM的CPU生态（Grace+MediaTek）、微软的操作系统安全框架（Windows原生Agent原语）、台积电的制造工艺（配合cuLitho/cuEST优化）、100+软件合作伙伴的生态承诺。这不是一家公司的产品发布，这是一个产业联盟对新计算范式的集体押注。

更深层的洞察在于：Nvidia正在完成一次身份的再次转变。

第一次转变（2015-2020）：从”GPU制造商”变成”AI算力提供商”——CUDA生态+数据中心GPU主导了这个转变。

第二次转变（2020-2025）：从”AI算力提供商”变成”AI基础设施公司”——DGX系统、NVLink网络、Spectrum-X以太网主导了这个转变。

第三次转变（2026-？）：从”AI基础设施公司”变成”个人AI时代的平台公司”——RTX Spark+OpenShell+Agent Toolkit是这个转变的起点宣言。

过去，Nvidia的客户是超大规模云服务商和企业数据中心。现在，Nvidia正在直接面向10亿量级的个人用户——通过他们每天使用的PC，通过他们每天运行的Agent，通过他们每天产生的数据。这是一次从B2B到B2C（通过B2B渠道）的战略扩张，是Nvidia市场天花板的又一次向上重写。

对竞争格局的影响同样值得深思。Intel花了十年试图守住x86架构在移动端的地位，最终被苹果M1用ARM替代了Mac；现在Nvidia同样用ARM进入PC市场，而且携带的不是”兼容方案”，是一个完整的AI Agent原生平台。AMD的移动端GPU（Radeon RX 9000M系列）在性能上可以与RTX系列竞争，但在AI算力架构（FP4+Tensor Core）和软件生态（CUDA+1000+应用）上的积累差距，短期内难以追平。苹果Apple Silicon在Mac端建立了坚实的AI PC先例，但苹果生态是封闭的——而RTX Spark+Windows组合面向的是80%+的全球PC市场，是苹果永远无法触达的那片土地。

黄仁勋今天在台北说的那句话，值得最后再看一遍：

“四十年来，你点击应用程序。Click。Type。现在，你来问——PC来干活。”

四十年的PC历史，正在以一块芯片为界，翻到新的一章。

一个还没有答案的问题：价格

发布会之后，最常被问到的问题是：RTX Spark究竟要多少钱？

Nvidia没有给出具体数字。ASUS、Dell、HP、Lenovo、Microsoft Surface和MSI的搭载RTX Spark的产品都将在今秋（2026年秋季）推出，具体定价由OEM厂商决定。

从已知信息推测价格区间：

RTX Spark的目标是替代当前旗舰游戏本和专业工作站笔记本市场
当前同类配置（高端Blackwell移动GPU+大容量内存）的笔记本定价在2500-5000美元区间
ARM架构的RTX Spark理论上能效优于x86竞品，但首代产品通常有溢价

“让每个家庭和每张桌子都有无限量智能”——Satya Nadella的愿景如果要成为现实，RTX Spark的最终定价将是一个关键变量。一台3000-4000美元的”个人AI电脑”，仍然属于专业用户市场，而不是真正的大众消费品。真正的范式转移，需要等待第二代、第三代产品把成本降到主流消费者可以接受的水平。

这不会否定RTX Spark今天的历史意义——但它提醒我们区分两件事：技术可行性的宣告，和大众普及的时间线。前者发生在今天台北的发布台上，后者还需要时间。

参考资料：

NVIDIA官方新闻稿：NVIDIA and Microsoft Reinvent Windows PCs for the Age of Personal AI (2026-06-01) — nvidianews.nvidia.com
NVIDIA官方新闻稿：NVIDIA Releases Major Collection of Open Source Agent Tools and Skills for Physical AI (2026-06-01) — nvidianews.nvidia.com
NVIDIA官方新闻稿：NVIDIA and TSMC Bring AI Into Fabs to Advance Semiconductor Design and Manufacturing (2026-06-01) — nvidianews.nvidia.com
Forbes: Nvidia Shows Off First Windows Laptops and Desktops Powered Entirely by Its Own Chip (2026-06-01) — forbes.com/siladityaray
CNBC: Nvidia’s new chip to power fresh line of Windows laptops by Dell, HP (2026-06-01) — cnbc.com

当「点击」变成「询问」：Nvidia RTX Spark与PC四十年最大范式转移

当「点击」变成「询问」：Nvidia RTX Spark与PC四十年最大范式转移

一块芯片的革命性配方

为什么120亿参数是一条分水岭——而1200亿才是终点

四十年的PC范式，在这一刻翻页

微软的角色：安全基础设施是这次合作的真正核心

第一层：Windows原生安全原语（Native Security Primitives）

第二层：NVIDIA OpenShell运行时

Adobe的重新架构：一个市场信号的精准解读

从软件到硅片：TSMC合作揭示的产业闭环

物理AI的开源基础设施：下一个边界已开放

对立视角：理性审视这次革命的边界

洞察：PC行业的”M1时刻”，以及它的更大野心

一个还没有答案的问题：价格

Tags:

About

Categories

Recent Posts

Resources