当Sundar Pichai说「奇点的山麓」:Google I/O 2026,一家搜索公司宣布变成AI操作系统
2026年5月19日,Mountain View。Sundar Pichai走上Google I/O 2026的舞台,用一个词打开了演讲:「agentic」。
这是Google年度最大开发者大会的第10年AI转型节点。会场外,Anthropic刚刚在CNBC Disruptor 50榜单上超越OpenAI拿下第一,估值传言达9000亿美元;OpenAI同日宣布Guaranteed Capacity产品,邀请企业客户以1-3年期承诺锁定算力。
Google需要一个答案。
它给出的答案,不是一个,而是13个。
从9.7万亿到3.2千万亿:一个数字讲清了Google的AI现在
Pichai在台上说了一个让全场安静的数字。
2年前,Google每月处理9.7万亿个token。一年前的I/O,这个数字是480万亿。今天——3.2千万亿(quadrillion)。
7倍增速,一年。
「这不只是一个关于我们产品的故事,」他说,「它说明了人们正在用AI做什么,以及开发者正在创造什么。」数据背书:超过850万开发者每月在Google模型上构建应用,API每分钟处理190亿个token,过去12个月,375家Google Cloud客户中的每一家都处理超过1万亿token。
这是Google的底气来源。尽管在ChatGPT崛起的头两年被市场和媒体质疑「落后」,Google用一个数字提醒所有人:它的基础设施规模,仍然是任何竞争者短期内无法企及的。
但规模不等于赢。Pichai清楚这一点,所以I/O 2026的核心不是「我们有多大」,而是「我们现在要改变什么」。
答案是:从工具,变成操作系统。
Gemini 3.5 Flash:「你不再需要用质量换速度」
I/O 2026的第一颗子弹是Gemini 3.5 Flash。
Google称,新模型在编码、Agentic任务和多模态基准测试中超越了3.1 Pro,同时保持了Flash系列的速度和成本优势——输出token速度是其他前沿模型的4倍,价格约为同级竞争对手的一半到三分之一。
从2026年5月19日起,Gemini 3.5 Flash成为Gemini应用和Search AI Mode的默认模型,全球范围推送。
Pichai在媒体吹风会上说了一句话,值得反复咀嚼:「你不再需要用质量换速度。」这句话针对的是一个长久以来的产品设计悖论——更快的模型往往意味着更浅的推理,更聪明的模型往往意味着更长的等待。Gemini 3.5 Flash声称打破了这个悖论。
与此同时,Gemini 3.5 Pro正在Google内部使用,预计下个月面向更广泛用户发布。
值得注意的是,Google在安全性上做了显著改进:「更不可能生成有害内容,同时更不可能错误地将安全查询标记为不安全。」这是对近期AI安全争议的直接回应——Claude Opus 4.7的「过度防御悖论」和GPT-5.5的误判问题都在行业内引发讨论,Google在此时强调双向改进,是有意识的竞争定位。
Gemini Spark:24/7个人AI Agent,睡觉时还在帮你干活
如果说Gemini 3.5 Flash是「更好的工具」,那么Gemini Spark就是「完全不同的东西」。
Google将Spark定义为「24/7个人AI Agent」——基于云端虚拟机运行,用户锁屏之后它仍在后台工作。它可以连接Google Workspace(Docs、Gmail、Sheets、Slides),以及第三方应用(Canva、Instacart等),执行任务的同时用户不需要在场。
Spark的能力包括:
- 写邮件、创建学习指南
- 监控信用卡隐藏费用
- 构建用户自定义工作流
- 连接macOS本地文件(即将上线)
这是Google对「AI Agent操作系统」这个概念的第一次正式落地。它与OpenAI的Codex Labs(嵌入开发者工作流)、Anthropic的Claude Managed Agents(企业服务编排)、微软Copilot的Agent Mode(Office生态)是同一赛道上的不同实现。
不同在于:Spark是面向消费者的。它不需要IT部门审批,不需要API密钥,不需要企业订阅。下周起,Google AI Ultra订阅者可以优先访问。
这里有一个关键的商业逻辑:
Google AI Ultra的定价,从$249.99/月大幅降至$100/月。
这不是价格战,这是重新定义门槛。
OpenAI ChatGPT Pro定价$200/月,Anthropic Claude Max定价$200/月。Google把AI Ultra降到$100,直接对标Claude Pro($20)和ChatGPT Plus($20)这一层级,同时提供旗舰级服务。这意味着什么?意味着Google愿意牺牲ARPU(每用户平均收入),换取订阅规模——而背后支撑这个策略的,是Google Cloud的基础设施利润率。
Gemini应用目前拥有9亿月活用户,覆盖230+国家和70+语言。Google需要把这9亿人中的尽可能多转化为付费用户。$100/月的门槛,是一个经过测算的转化杠杆。
Gemini Omni:「你给它一段视频,它改写你想要的一切」
I/O 2026的第三张牌,是一个全新的模型家族:Gemini Omni。
与Gemini 3.5的「更快更强」不同,Omni代表的是一次模式跃迁。Google将其定义为「世界模型」(world model)——能够模拟物理环境,根据用户行为预测接下来发生什么。
理解这个概念需要一个区分:普通生成模型(如Sora、Veo)是从文本描述生成像素序列,它们学的是「图像长什么样」。世界模型学的是「物理规律」——物体怎么运动、光线怎么折射、动作会带来什么后果。这使Omni可以做普通视频生成模型做不到的事:不只是「生成一段看起来像X的视频」,而是「模拟X场景中会发生什么」。
第一个版本Omni Flash,从2026年5月19日起在Gemini应用、Google Flow和YouTube Shorts上线。它的输入可以是文本、照片、视频和音频的任意组合,输出是视频。
Google给了一个让人印象深刻的演示场景:「给它一个简单提示——’用黏土动画解释蛋白质折叠’——它会生成高质量、一致的视频。」另一个场景:「给它一段你拍的视频,它可以编辑动作、添加新角色或物体。」
这是对Adobe、Runway、Sora的正面竞争,也是对「多模态生成」赛道的最大规模入场。
技术背景:世界模型在Google DeepMind已研究多年(主要用于机器人和游戏),Omni是将这项研究首次大规模产品化的尝试。DeepMind CEO Demis Hassabis用了一句意味深长的话来描述当前时刻:「这可能是奇点的山麓(the foothills of a singularity)。」
从商业角度,Gemini Omni直接打开了一个此前Google没有充分参与的市场:创意内容生成。YouTube是Google最大的内容平台,Omni在YouTube Shorts上的上线,意味着创作者可以直接在平台内用AI生成、编辑视频,无需跳转到第三方工具。这是一个强大的生态闭环:创作者留在YouTube,YouTube保住创作者,Google收订阅费,广告收入不流失。
这句话有两种读法。
第一种读法是自信:Google现在站在技术加速的起跑线上,接下来的加速是指数级的。
第二种读法是警告:奇点的山麓意味着前方是陡坡,没有人真正知道顶在哪里,也没有人知道往上走要承担什么。
Gemini Spark背后:「AI操作系统」争夺战的真正逻辑
理解Gemini Spark,需要先理解一个更大的竞争背景:2026年上半年,AI领域最激烈的争夺已经从「谁的模型更聪明」转向「谁能成为用户设备上的后台操作系统」。
微软Copilot已经深嵌Office 365,每天有数亿企业用户在Word、Excel、Teams中与它交互。OpenAI的Codex和Managed Agents正在嵌入企业级开发工作流,与Anthropic争夺最高技术密度的客户群体。Anthropic Claude Managed Agents瞄准企业服务编排——尤其是KPMG这样的服务机构用它来包装和分发咨询能力。
在这场「后台时间」争夺战中,Google一直有一个无人能比的优势,又有一个无法回避的劣势。
优势是规模:Gemini应用9亿月活用户,Search全球每天80亿次查询,Gmail 20亿用户,YouTube 25亿月活用户。没有任何AI公司拥有与Google同等级别的用户接触面。
劣势是习惯:Google的用户把它用作「查询工具」,而不是「任务执行者」。人们去Google找答案,不是去Google做事。这个行为习惯的改变,比任何技术问题都难。
Gemini Spark本质上是Google对这个劣势的正面攻击。它不等用户「来问」,而是「主动做」——写好邮件草稿放在那里,把明天的日程整理好,把信用卡账单里的隐藏收费标注出来。
这是AI助手和AI Agent的根本区别:助手等指令,Agent主动行动。
Spark的定位选择也值得关注——它面向消费者,而不是企业。这与OpenAI的策略(Managed Agents面向企业API客户)和Anthropic的策略(通过KPMG等渠道服务企业)都不同。Google的判断是:改变AI助手习惯,从B2C开始比B2B更快。因为企业有IT审批流程,个人用户只需要打开一个应用。
$100/月的AI Ultra定价,正是为了降低个人用户的心理门槛。
Project Aura智能眼镜:硬件战线正式打开
I/O 2026还有一个硬件层面的信号,尽管不是主角,但不应被忽略。
Google展示了与Xreal合作的Project Aura智能眼镜更新版本。外部计算扩展设备被重新设计,增加了指纹传感器和挂绳。同时,两款新的Android XR智能眼镜品牌合作伙伴——Warby Parker和Gentle Monster——今秋推出,功能包括实时翻译、导航辅助和通知摘要(音频输出,无显示屏)。
这是对Meta Ray-Ban眼镜路线的正面回应。Meta的Ray-Ban智能眼镜2024-2025年已售出数百万副,证明了无显示屏轻量眼镜的消费市场存在。Google选择跟随这条路,而不是继续押注头戴式AR显示设备,是一次务实的路线调整。
更重要的信号是Gemini与XR的整合:日历、Keep、本地搜索、实时翻译,全部通过Gemini在眼镜上实现。这意味着Gemini的「多端渗透」战略是认真的——不只是手机和电脑,而是戴在用户脸上的设备。
从搜索框到「生成界面」:Search的形态已经变了
I/O 2026发布的产品中,有一类最容易被忽视,但可能是Google核心商业模式变革的信号:Search的重构。
搜索框扩展:现在会根据长查询自动扩展,并显示AI生成的建议(类似自动补全但更智能)。
多模态输入:搜索不再限于文本——可以用图片、文件、视频、甚至Chrome标签页作为搜索输入。
Information Agents:对特定话题或问题的持续监控Agent,从博客、新闻、社交媒体汇聚更新,「今夏上线,先面向AI Pro和Ultra订阅用户」。
生成式UI:搜索可以实时生成模拟、交互表格和图表——不是搜索结果,而是直接为你的查询生成一个定制的可交互界面。
Mini Apps:对于用户多次搜索的任务,Search将生成专属「迷你应用」——比如活动策划的定制仪表盘。
这些变化合在一起,指向一个方向:Google在把搜索从「信息检索工具」变成「任务执行界面」。这与Gemini Spark的逻辑是连贯的——Spark处理后台任务,Search处理当下的交互任务,两者共同构成一个「AI操作系统」的前端。
问题在于:这还是「搜索」吗?
广告收入是Google的命脉,而传统搜索广告的逻辑建立在「用户点击链接」这个行为上。如果Search变成了直接生成答案和任务界面,「点击」减少,广告模式如何转型?Google在I/O上没有正面回答这个问题。这是投资者需要关注的灰犀牛。
Universal Cart:当Google的野心蔓延到零售业
Google I/O 2026发布了一个看似「小产品」的东西:Universal Cart(通用购物车)。
它的逻辑是这样的:用户可以从YouTube、Search、Gemini、Gmail中将商品加入一个统一的购物车,然后跨商家结算。Google宣布支持的商家包括Nike、Target、Walmart、Ulta Beauty、Sephora、Wayfair、Shopify。
购物车具备AI智能功能——自动标记不兼容商品(比如买电脑配件时发现零件不匹配),解读Google Wallet中的会员积分和优惠,帮用户找到最优结算方案。
这今夏先在Search和Gemini上线,YouTube和Gmail随后跟进。
表面看,这是一个电商功能。实质上,这是Google进入「Agentic Commerce」赛道的宣言——AI不只帮你搜索,还帮你决策和购买。
这里有一个有趣的竞争对比:OpenAI在前一天宣布Guaranteed Capacity,帮企业锁定算力;Google在同一天宣布Universal Cart,帮消费者完成跨平台购买。两家公司的战场在同步扩张,但方向不同——OpenAI向B端的基础设施渗透,Google向C端的日常行为渗透。
谁的策略更持久?这个问题目前没有答案,但可以确定的是:两条路都指向「AI成为中间层」的未来。
AI Studio Vibe Coding:搜索引擎要给开发者一个新的「Play Store入口」
I/O 2026中另一个颇具野心的公告,是Google AI Studio支持「Vibe Coding」生成原生Android应用,并最终可以发布到Play Store。
流程是这样的:用户用自然语言提示生成完整的Android应用,AI Studio内置Android模拟器,可以直接在手机上安装测试,应用可以导出到Android Studio或GitHub,或者直接发布到Play Store(目前限好友和家人,未来公开)。
这是Google对Cursor、Replit等AI编程工具的正面回应,也是对Apple App Store的间接挑战——如果生成原生Android应用的门槛大幅降低,Play Store的应用数量将爆炸式增长,与此同时,「个人开发者单人创业」的可能性大幅提升。
配合Firebase集成,这实际上是Google将AI生成应用直接接入其云基础设施的完整闭环。开发者不只是在生成代码,而是在生成「可部署的云服务」。
Content Provenance联盟:Google与OpenAI的一次不寻常的联手
I/O 2026还有一个低调但意义深远的公告:Google将SynthID水印技术与内容溯源标准C2PA整合。
与此同时,OpenAI在同一天宣布加入C2PA指导委员会,并集成Google的SynthID隐形水印,为所有AI生成的图像、音频、视频和文本打标。
这是竞争者之间少见的主动协调:两家公司在内容真实性标准上选择对齐,而不是各自建立封闭标准。
背后的逻辑是压力驱动:欧盟AI法案、美国AI内容披露要求,以及日益严重的深度伪造问题,使得「证明内容来源」成为所有AI平台的合规义务。Google和OpenAI选择共同推进一个标准,比各自为政更有利于整个行业的合规效率,也减少了被监管机构要求强制统一的风险。
Google还宣布,Chrome和Search即将支持用户直接圈选网页图片,查看SynthID水印和C2PA Content Credentials来源信息。
三个对立视角:Google的I/O 2026到底是什么?
视角A:Google终于不再是追赶者
在过去两年,「Google落后了」是科技媒体的主流叙事。ChatGPT在2022年底横空出世,Google仓促发布Bard(现Gemini),在一个演示中翻车;OpenAI接连发布GPT-4、4o、4.5、5.5,Anthropic发布Claude Sonnet、Opus系列,Google的发布节奏和叙事能力都显得慌乱。
但I/O 2026是一次系统性的反击。
Gemini 3.5 Flash的技术指标、Gemini Spark的产品设计、Omni的模型野心、AI Ultra的定价调整,共同指向一个清晰的战略:Google不打算在某一个细分赛道与对手竞争,而是建立一个覆盖从基础模型到应用生态的完整栈。
视角B:Google的历史是发布多、执行弱
批评者会说:Google有一个众所周知的问题——发布很多,但很少真正做到。
谷歌阅读器被关闭,Stadia被关闭,Google+被关闭,Allo被关闭。每年I/O上宣布的产品,都不是全部最终活下来的。
Gemini Spark目前只对「可信测试者」和Ultra订阅用户开放——这意味着它的实际可用性尚未经过大规模用户验证。Universal Cart也是「今夏上线」,而不是现在可用。AI Studio Vibe Coding的Play Store发布功能还在测试阶段。
Demis Hassabis的「奇点山麓」可以是激励,也可以是掩盖执行风险的宏大叙事。
视角C:Google正在破坏自己的商业模式
这是最微妙也最重要的对立视角。
Google 2025财年广告收入仍占总收入的73%。而I/O 2026宣布的几乎所有产品,都指向减少用户「点击链接」的行为——Information Agents直接推送摘要,Gemini Spark代替用户执行任务,Search生成界面而不是链接列表。
如果这些产品全部成功,Google核心的广告商业模式将面临系统性冲击。Google在用自己的AI产品挖自己的根基。
这不是Google不知道的风险。但问题是:如果不这样做,OpenAI和Anthropic会帮它做。主动蚕食自己,总好过被人蚕食。
3.2千万亿token的真正含义
回到Pichai开场的那个数字:3.2千万亿token/月。
这个数字背后,有一个被忽视的细节:Pichai说,这不只是Google产品的使用量,也包括「其他人正在构建什么」——8.5百万开发者,每人每月在Google模型上构建。
Google的战略不是把所有人留在Gemini应用里,而是让Gemini成为别人应用的底层。就像安卓不是只给Google用,而是给全球开发者生态用一样。
这是Google最深层的优势,也是最容易被忽视的壁垒:它在构建一个平台,而不只是一个产品。
Anthropic在构建最聪明的模型;OpenAI在构建最广泛的应用生态;Google在构建规模最大的基础设施平台。
三者的战略都有自洽的逻辑,但三者的最终对决,不会发生在2026年,而会发生在Spark、Managed Agents、和GPT-5在同一用户的设备上同时争夺「后台时间」的那一天。
那一天,比大多数人预想的更近。
一个没有人在谈的结构性矛盾
I/O 2026结束后,分析师和媒体的讨论集中在Gemini Spark的功能、AI Ultra的降价、Gemini Omni的演示效果。但有一个结构性矛盾几乎没有人深究:
Google正在同时做两件相互矛盾的事情。
一方面,它在用Spark和Information Agents减少用户对搜索链接的依赖。另一方面,它在Guaranteed Capacity竞争的背景下,还没有公布任何关于广告商业模式转型的清晰计划。
这不是小矛盾。广告收入占Google 2025年总收入的73%,约合2700亿美元。如果AI产品成功地把用户从「点击链接」的行为转向「直接在界面上完成任务」,那么每减少一次点击,理论上就减少一次广告曝光机会。
Google的内部回应可能是:AI可以直接在搜索界面嵌入广告,效果更精准、转化更高,ARPU可以补回甚至超过点击量的减少。这个逻辑在短期可能成立,但在更长的时间维度,当Spark的「代理购买」(如Universal Cart)替代了越来越多的手动搜索+点击,广告的位置和形态将面临根本性重构。
这是Google最难回答的问题,也是投资者最应该持续追踪的指标。
在「奇点的山麓」,每向上走一步,这个问题都会变得更尖锐。
参考资料:
- “The 13 biggest announcements at Google I/O 2026” — The Verge, 2026-05-19. https://www.theverge.com/tech/933415/google-io-2026-biggest-announcements-ai-gemini
- “Google debuts new AI models, personal AI agents in effort to keep pace with OpenAI and Anthropic” — CNBC, 2026-05-19. https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html
- “Google updates its Gemini app to take on ChatGPT and Claude at IO 2026” — TechCrunch, 2026-05-19. https://techcrunch.com/2026/05/19/google-updates-its-gemini-app-to-take-on-chatgpt-and-claude-at-io-2026/
- “I/O 2026: Welcome to the agentic Gemini era” — Google Blog (Sundar Pichai), 2026-05-19. https://blog.google/innovation-and-ai/sundar-pichai-io-2026/
- “Google AI Ultra, Gemini Spark, Omni” — CNBC, 2026-05-19. https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html