当Sundar Pichai说「奇点的山麓」：Google I/O 2026，一家搜索公司宣布变成AI操作系统

2026年5月19日，Mountain View。Sundar Pichai走上Google I/O 2026的舞台，用一个词打开了演讲：「agentic」。

这是Google年度最大开发者大会的第10年AI转型节点。会场外，Anthropic刚刚在CNBC Disruptor 50榜单上超越OpenAI拿下第一，估值传言达9000亿美元；OpenAI同日宣布Guaranteed Capacity产品，邀请企业客户以1-3年期承诺锁定算力。

Google需要一个答案。

它给出的答案，不是一个，而是13个。

从9.7万亿到3.2千万亿：一个数字讲清了Google的AI现在

Pichai在台上说了一个让全场安静的数字。

2年前，Google每月处理9.7万亿个token。一年前的I/O，这个数字是480万亿。今天——3.2千万亿（quadrillion）。

7倍增速，一年。

「这不只是一个关于我们产品的故事，」他说，「它说明了人们正在用AI做什么，以及开发者正在创造什么。」数据背书：超过850万开发者每月在Google模型上构建应用，API每分钟处理190亿个token，过去12个月，375家Google Cloud客户中的每一家都处理超过1万亿token。

这是Google的底气来源。尽管在ChatGPT崛起的头两年被市场和媒体质疑「落后」，Google用一个数字提醒所有人：它的基础设施规模，仍然是任何竞争者短期内无法企及的。

但规模不等于赢。Pichai清楚这一点，所以I/O 2026的核心不是「我们有多大」，而是「我们现在要改变什么」。

答案是：从工具，变成操作系统。

Gemini 3.5 Flash：「你不再需要用质量换速度」

I/O 2026的第一颗子弹是Gemini 3.5 Flash。

Google称，新模型在编码、Agentic任务和多模态基准测试中超越了3.1 Pro，同时保持了Flash系列的速度和成本优势——输出token速度是其他前沿模型的4倍，价格约为同级竞争对手的一半到三分之一。

从2026年5月19日起，Gemini 3.5 Flash成为Gemini应用和Search AI Mode的默认模型，全球范围推送。

Pichai在媒体吹风会上说了一句话，值得反复咀嚼：「你不再需要用质量换速度。」这句话针对的是一个长久以来的产品设计悖论——更快的模型往往意味着更浅的推理，更聪明的模型往往意味着更长的等待。Gemini 3.5 Flash声称打破了这个悖论。

与此同时，Gemini 3.5 Pro正在Google内部使用，预计下个月面向更广泛用户发布。

值得注意的是，Google在安全性上做了显著改进：「更不可能生成有害内容，同时更不可能错误地将安全查询标记为不安全。」这是对近期AI安全争议的直接回应——Claude Opus 4.7的「过度防御悖论」和GPT-5.5的误判问题都在行业内引发讨论，Google在此时强调双向改进，是有意识的竞争定位。

Gemini Spark：24/7个人AI Agent，睡觉时还在帮你干活

如果说Gemini 3.5 Flash是「更好的工具」，那么Gemini Spark就是「完全不同的东西」。

Google将Spark定义为「24/7个人AI Agent」——基于云端虚拟机运行，用户锁屏之后它仍在后台工作。它可以连接Google Workspace（Docs、Gmail、Sheets、Slides），以及第三方应用（Canva、Instacart等），执行任务的同时用户不需要在场。

Spark的能力包括：

写邮件、创建学习指南
监控信用卡隐藏费用
构建用户自定义工作流
连接macOS本地文件（即将上线）

这是Google对「AI Agent操作系统」这个概念的第一次正式落地。它与OpenAI的Codex Labs（嵌入开发者工作流）、Anthropic的Claude Managed Agents（企业服务编排）、微软Copilot的Agent Mode（Office生态）是同一赛道上的不同实现。

不同在于：Spark是面向消费者的。它不需要IT部门审批，不需要API密钥，不需要企业订阅。下周起，Google AI Ultra订阅者可以优先访问。

这里有一个关键的商业逻辑：

Google AI Ultra的定价，从$249.99/月大幅降至$100/月。

这不是价格战，这是重新定义门槛。

OpenAI ChatGPT Pro定价$200/月，Anthropic Claude Max定价$200/月。Google把AI Ultra降到$100，直接对标Claude Pro（$20）和ChatGPT Plus（$20）这一层级，同时提供旗舰级服务。这意味着什么？意味着Google愿意牺牲ARPU（每用户平均收入），换取订阅规模——而背后支撑这个策略的，是Google Cloud的基础设施利润率。

Gemini应用目前拥有9亿月活用户，覆盖230+国家和70+语言。Google需要把这9亿人中的尽可能多转化为付费用户。$100/月的门槛，是一个经过测算的转化杠杆。

Gemini Omni：「你给它一段视频，它改写你想要的一切」

I/O 2026的第三张牌，是一个全新的模型家族：Gemini Omni。

与Gemini 3.5的「更快更强」不同，Omni代表的是一次模式跃迁。Google将其定义为「世界模型」（world model）——能够模拟物理环境，根据用户行为预测接下来发生什么。

理解这个概念需要一个区分：普通生成模型（如Sora、Veo）是从文本描述生成像素序列，它们学的是「图像长什么样」。世界模型学的是「物理规律」——物体怎么运动、光线怎么折射、动作会带来什么后果。这使Omni可以做普通视频生成模型做不到的事：不只是「生成一段看起来像X的视频」，而是「模拟X场景中会发生什么」。

第一个版本Omni Flash，从2026年5月19日起在Gemini应用、Google Flow和YouTube Shorts上线。它的输入可以是文本、照片、视频和音频的任意组合，输出是视频。

Google给了一个让人印象深刻的演示场景：「给它一个简单提示——’用黏土动画解释蛋白质折叠’——它会生成高质量、一致的视频。」另一个场景：「给它一段你拍的视频，它可以编辑动作、添加新角色或物体。」

这是对Adobe、Runway、Sora的正面竞争，也是对「多模态生成」赛道的最大规模入场。

技术背景：世界模型在Google DeepMind已研究多年（主要用于机器人和游戏），Omni是将这项研究首次大规模产品化的尝试。DeepMind CEO Demis Hassabis用了一句意味深长的话来描述当前时刻：「这可能是奇点的山麓（the foothills of a singularity）。」

从商业角度，Gemini Omni直接打开了一个此前Google没有充分参与的市场：创意内容生成。YouTube是Google最大的内容平台，Omni在YouTube Shorts上的上线，意味着创作者可以直接在平台内用AI生成、编辑视频，无需跳转到第三方工具。这是一个强大的生态闭环：创作者留在YouTube，YouTube保住创作者，Google收订阅费，广告收入不流失。

这句话有两种读法。

第一种读法是自信：Google现在站在技术加速的起跑线上，接下来的加速是指数级的。

第二种读法是警告：奇点的山麓意味着前方是陡坡，没有人真正知道顶在哪里，也没有人知道往上走要承担什么。

Gemini Spark背后：「AI操作系统」争夺战的真正逻辑

理解Gemini Spark，需要先理解一个更大的竞争背景：2026年上半年，AI领域最激烈的争夺已经从「谁的模型更聪明」转向「谁能成为用户设备上的后台操作系统」。

微软Copilot已经深嵌Office 365，每天有数亿企业用户在Word、Excel、Teams中与它交互。OpenAI的Codex和Managed Agents正在嵌入企业级开发工作流，与Anthropic争夺最高技术密度的客户群体。Anthropic Claude Managed Agents瞄准企业服务编排——尤其是KPMG这样的服务机构用它来包装和分发咨询能力。

在这场「后台时间」争夺战中，Google一直有一个无人能比的优势，又有一个无法回避的劣势。

优势是规模：Gemini应用9亿月活用户，Search全球每天80亿次查询，Gmail 20亿用户，YouTube 25亿月活用户。没有任何AI公司拥有与Google同等级别的用户接触面。

劣势是习惯：Google的用户把它用作「查询工具」，而不是「任务执行者」。人们去Google找答案，不是去Google做事。这个行为习惯的改变，比任何技术问题都难。

Gemini Spark本质上是Google对这个劣势的正面攻击。它不等用户「来问」，而是「主动做」——写好邮件草稿放在那里，把明天的日程整理好，把信用卡账单里的隐藏收费标注出来。

这是AI助手和AI Agent的根本区别：助手等指令，Agent主动行动。

Spark的定位选择也值得关注——它面向消费者，而不是企业。这与OpenAI的策略（Managed Agents面向企业API客户）和Anthropic的策略（通过KPMG等渠道服务企业）都不同。Google的判断是：改变AI助手习惯，从B2C开始比B2B更快。因为企业有IT审批流程，个人用户只需要打开一个应用。

$100/月的AI Ultra定价，正是为了降低个人用户的心理门槛。

Project Aura智能眼镜：硬件战线正式打开

I/O 2026还有一个硬件层面的信号，尽管不是主角，但不应被忽略。

Google展示了与Xreal合作的Project Aura智能眼镜更新版本。外部计算扩展设备被重新设计，增加了指纹传感器和挂绳。同时，两款新的Android XR智能眼镜品牌合作伙伴——Warby Parker和Gentle Monster——今秋推出，功能包括实时翻译、导航辅助和通知摘要（音频输出，无显示屏）。

这是对Meta Ray-Ban眼镜路线的正面回应。Meta的Ray-Ban智能眼镜2024-2025年已售出数百万副，证明了无显示屏轻量眼镜的消费市场存在。Google选择跟随这条路，而不是继续押注头戴式AR显示设备，是一次务实的路线调整。

更重要的信号是Gemini与XR的整合：日历、Keep、本地搜索、实时翻译，全部通过Gemini在眼镜上实现。这意味着Gemini的「多端渗透」战略是认真的——不只是手机和电脑，而是戴在用户脸上的设备。

从搜索框到「生成界面」：Search的形态已经变了

I/O 2026发布的产品中，有一类最容易被忽视，但可能是Google核心商业模式变革的信号：Search的重构。

搜索框扩展：现在会根据长查询自动扩展，并显示AI生成的建议（类似自动补全但更智能）。

多模态输入：搜索不再限于文本——可以用图片、文件、视频、甚至Chrome标签页作为搜索输入。

Information Agents：对特定话题或问题的持续监控Agent，从博客、新闻、社交媒体汇聚更新，「今夏上线，先面向AI Pro和Ultra订阅用户」。

生成式UI：搜索可以实时生成模拟、交互表格和图表——不是搜索结果，而是直接为你的查询生成一个定制的可交互界面。

Mini Apps：对于用户多次搜索的任务，Search将生成专属「迷你应用」——比如活动策划的定制仪表盘。

这些变化合在一起，指向一个方向：Google在把搜索从「信息检索工具」变成「任务执行界面」。这与Gemini Spark的逻辑是连贯的——Spark处理后台任务，Search处理当下的交互任务，两者共同构成一个「AI操作系统」的前端。

问题在于：这还是「搜索」吗？

广告收入是Google的命脉，而传统搜索广告的逻辑建立在「用户点击链接」这个行为上。如果Search变成了直接生成答案和任务界面，「点击」减少，广告模式如何转型？Google在I/O上没有正面回答这个问题。这是投资者需要关注的灰犀牛。

Universal Cart：当Google的野心蔓延到零售业

Google I/O 2026发布了一个看似「小产品」的东西：Universal Cart（通用购物车）。

它的逻辑是这样的：用户可以从YouTube、Search、Gemini、Gmail中将商品加入一个统一的购物车，然后跨商家结算。Google宣布支持的商家包括Nike、Target、Walmart、Ulta Beauty、Sephora、Wayfair、Shopify。

购物车具备AI智能功能——自动标记不兼容商品（比如买电脑配件时发现零件不匹配），解读Google Wallet中的会员积分和优惠，帮用户找到最优结算方案。

这今夏先在Search和Gemini上线，YouTube和Gmail随后跟进。

表面看，这是一个电商功能。实质上，这是Google进入「Agentic Commerce」赛道的宣言——AI不只帮你搜索，还帮你决策和购买。

这里有一个有趣的竞争对比：OpenAI在前一天宣布Guaranteed Capacity，帮企业锁定算力；Google在同一天宣布Universal Cart，帮消费者完成跨平台购买。两家公司的战场在同步扩张，但方向不同——OpenAI向B端的基础设施渗透，Google向C端的日常行为渗透。

谁的策略更持久？这个问题目前没有答案，但可以确定的是：两条路都指向「AI成为中间层」的未来。

AI Studio Vibe Coding：搜索引擎要给开发者一个新的「Play Store入口」

I/O 2026中另一个颇具野心的公告，是Google AI Studio支持「Vibe Coding」生成原生Android应用，并最终可以发布到Play Store。

流程是这样的：用户用自然语言提示生成完整的Android应用，AI Studio内置Android模拟器，可以直接在手机上安装测试，应用可以导出到Android Studio或GitHub，或者直接发布到Play Store（目前限好友和家人，未来公开）。

这是Google对Cursor、Replit等AI编程工具的正面回应，也是对Apple App Store的间接挑战——如果生成原生Android应用的门槛大幅降低，Play Store的应用数量将爆炸式增长，与此同时，「个人开发者单人创业」的可能性大幅提升。

配合Firebase集成，这实际上是Google将AI生成应用直接接入其云基础设施的完整闭环。开发者不只是在生成代码，而是在生成「可部署的云服务」。

Content Provenance联盟：Google与OpenAI的一次不寻常的联手

I/O 2026还有一个低调但意义深远的公告：Google将SynthID水印技术与内容溯源标准C2PA整合。

与此同时，OpenAI在同一天宣布加入C2PA指导委员会，并集成Google的SynthID隐形水印，为所有AI生成的图像、音频、视频和文本打标。

这是竞争者之间少见的主动协调：两家公司在内容真实性标准上选择对齐，而不是各自建立封闭标准。

背后的逻辑是压力驱动：欧盟AI法案、美国AI内容披露要求，以及日益严重的深度伪造问题，使得「证明内容来源」成为所有AI平台的合规义务。Google和OpenAI选择共同推进一个标准，比各自为政更有利于整个行业的合规效率，也减少了被监管机构要求强制统一的风险。

Google还宣布，Chrome和Search即将支持用户直接圈选网页图片，查看SynthID水印和C2PA Content Credentials来源信息。

三个对立视角：Google的I/O 2026到底是什么？

视角A：Google终于不再是追赶者

在过去两年，「Google落后了」是科技媒体的主流叙事。ChatGPT在2022年底横空出世，Google仓促发布Bard（现Gemini），在一个演示中翻车；OpenAI接连发布GPT-4、4o、4.5、5.5，Anthropic发布Claude Sonnet、Opus系列，Google的发布节奏和叙事能力都显得慌乱。

但I/O 2026是一次系统性的反击。

Gemini 3.5 Flash的技术指标、Gemini Spark的产品设计、Omni的模型野心、AI Ultra的定价调整，共同指向一个清晰的战略：Google不打算在某一个细分赛道与对手竞争，而是建立一个覆盖从基础模型到应用生态的完整栈。

视角B：Google的历史是发布多、执行弱

批评者会说：Google有一个众所周知的问题——发布很多，但很少真正做到。

谷歌阅读器被关闭，Stadia被关闭，Google+被关闭，Allo被关闭。每年I/O上宣布的产品，都不是全部最终活下来的。

Gemini Spark目前只对「可信测试者」和Ultra订阅用户开放——这意味着它的实际可用性尚未经过大规模用户验证。Universal Cart也是「今夏上线」，而不是现在可用。AI Studio Vibe Coding的Play Store发布功能还在测试阶段。

Demis Hassabis的「奇点山麓」可以是激励，也可以是掩盖执行风险的宏大叙事。

视角C：Google正在破坏自己的商业模式

这是最微妙也最重要的对立视角。

Google 2025财年广告收入仍占总收入的73%。而I/O 2026宣布的几乎所有产品，都指向减少用户「点击链接」的行为——Information Agents直接推送摘要，Gemini Spark代替用户执行任务，Search生成界面而不是链接列表。

如果这些产品全部成功，Google核心的广告商业模式将面临系统性冲击。Google在用自己的AI产品挖自己的根基。

这不是Google不知道的风险。但问题是：如果不这样做，OpenAI和Anthropic会帮它做。主动蚕食自己，总好过被人蚕食。

3.2千万亿token的真正含义

回到Pichai开场的那个数字：3.2千万亿token/月。

这个数字背后，有一个被忽视的细节：Pichai说，这不只是Google产品的使用量，也包括「其他人正在构建什么」——8.5百万开发者，每人每月在Google模型上构建。

Google的战略不是把所有人留在Gemini应用里，而是让Gemini成为别人应用的底层。就像安卓不是只给Google用，而是给全球开发者生态用一样。

这是Google最深层的优势，也是最容易被忽视的壁垒：它在构建一个平台，而不只是一个产品。

Anthropic在构建最聪明的模型；OpenAI在构建最广泛的应用生态；Google在构建规模最大的基础设施平台。

三者的战略都有自洽的逻辑，但三者的最终对决，不会发生在2026年，而会发生在Spark、Managed Agents、和GPT-5在同一用户的设备上同时争夺「后台时间」的那一天。

那一天，比大多数人预想的更近。

一个没有人在谈的结构性矛盾

I/O 2026结束后，分析师和媒体的讨论集中在Gemini Spark的功能、AI Ultra的降价、Gemini Omni的演示效果。但有一个结构性矛盾几乎没有人深究：

Google正在同时做两件相互矛盾的事情。

一方面，它在用Spark和Information Agents减少用户对搜索链接的依赖。另一方面，它在Guaranteed Capacity竞争的背景下，还没有公布任何关于广告商业模式转型的清晰计划。

这不是小矛盾。广告收入占Google 2025年总收入的73%，约合2700亿美元。如果AI产品成功地把用户从「点击链接」的行为转向「直接在界面上完成任务」，那么每减少一次点击，理论上就减少一次广告曝光机会。

Google的内部回应可能是：AI可以直接在搜索界面嵌入广告，效果更精准、转化更高，ARPU可以补回甚至超过点击量的减少。这个逻辑在短期可能成立，但在更长的时间维度，当Spark的「代理购买」（如Universal Cart）替代了越来越多的手动搜索+点击，广告的位置和形态将面临根本性重构。

这是Google最难回答的问题，也是投资者最应该持续追踪的指标。

在「奇点的山麓」，每向上走一步，这个问题都会变得更尖锐。

参考资料:

“The 13 biggest announcements at Google I/O 2026” — The Verge, 2026-05-19. https://www.theverge.com/tech/933415/google-io-2026-biggest-announcements-ai-gemini
“Google debuts new AI models, personal AI agents in effort to keep pace with OpenAI and Anthropic” — CNBC, 2026-05-19. https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html
“Google updates its Gemini app to take on ChatGPT and Claude at IO 2026” — TechCrunch, 2026-05-19. https://techcrunch.com/2026/05/19/google-updates-its-gemini-app-to-take-on-chatgpt-and-claude-at-io-2026/
“I/O 2026: Welcome to the agentic Gemini era” — Google Blog (Sundar Pichai), 2026-05-19. https://blog.google/innovation-and-ai/sundar-pichai-io-2026/
“Google AI Ultra, Gemini Spark, Omni” — CNBC, 2026-05-19. https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html