Transformer架构的亲生父亲,用了两次才让谷歌明白:他永远属于那个最激进的地方

2026年6月18日,Noam Shazeer在X上发了一条简短的推文:

“我很高兴地分享,我将加入OpenAI,期待与那里出色的团队合作。离开是一个艰难的决定。我为谷歌的团队和我们共同构建的一切感到无比自豪。能与大家共事,是我的荣幸与快乐。”

这条推文的发布者,是谷歌Gemini模型的联合负责人、谷歌工程副总裁。更重要的,他是2017年那篇改变了整个人类文明走向的论文”Attention Is All You Need”的共同作者之一——Transformer架构的缔造者之一。

他要去OpenAI了。

在人工智能这个行业里,很少有哪条消息同时拥有如此密度的历史符号:一个人在同一家公司进进出出两次,最终选择了那个让他的母公司最不安的对手。这不只是一条人才流动新闻。这是一个关于”谁在定义AI的未来速度”的宣判,也是一面镜子,映出了大型科技公司在AI时代最深的结构性焦虑。


一、”Attention Is All You Need”背后的人

2017年,谷歌发表了一篇论文,题目叫做”Attention Is All You Need”。这篇8页的文章里,提出了一种叫做Transformer的神经网络架构。它引入了自注意力机制(Self-Attention),允许模型在处理序列数据时同时关注所有位置,而不是像之前的RNN/LSTM那样逐步处理。

在那之后不到10年,GPT-4、Gemini、Claude、Llama——几乎所有你叫得出名字的大语言模型,都是Transformer的直系后代。现代AI的整个智能体系,都建立在那8页纸提出的数学框架之上。

Noam Shazeer是这篇论文的共同作者之一。

但更早的背景是:在参与写那篇论文之前,Shazeer在谷歌已经工作了整整17年——从2000年加入谷歌开始,他的第一件重要的事是改进谷歌搜索引擎的拼写纠错器。在那个互联网刚刚起步的年代,一个好用的拼写纠错器是数亿用户搜索体验的核心基础设施。他从那里出发,一路做到了谷歌最核心的研究团队,参与了包括Google Brain在内的无数重要项目,成为了谷歌技术史上最具标志性的工程师之一。

也正是因为有如此深厚的技术根基,当2017年Transformer论文发表时,学术界和工业界能够迅速感受到这个架构的潜力,并在接下来的几年里将其推向了所有AI应用的核心。

但技术贡献之外,Shazeer的故事里有一条更重要的线索:他和谷歌之间,从来不只是雇主与雇员的关系,而是两种截然不同的”速度观”之间的持续博弈。


二、第一次出走:谷歌拒绝了聊天机器人

2021年,Shazeer和他的同事Daniel De Freitas离开了谷歌。

在那之前,他们在谷歌内部开发了一个叫做Meena的对话式AI系统。那是2020年,ChatGPT还要再等两年才会出现。Meena当时被认为是世界上最先进的聊天机器人之一,在自然对话能力上已经超过了当时大多数竞争者。

Shazeer和De Freitas认为这个产品应该发布出去。谷歌拒绝了。原因据悉涉及安全、品牌风险、以及谷歌对于”AI聊天产品”是否与谷歌搜索主业存在冲突的内部争议。

离职之后,De Freitas说了那句后来被广泛引用的话:”There are some overlaps, but we’re confident Google will never do anything fun.”(”有些重叠,但我们确信谷歌永远不会做出任何有趣的东西。”)

这句话不只是一个人的情绪,它代表了一种系统性的认知差距:大公司的安全系统、品牌管理逻辑、内部资源争夺机制,让它天然地对高风险、高速度的产品创新存在结构性抗拒。

Shazeer和De Freitas出走后创立了Character.AI。这家公司建立在对话式AI的核心技术上,用大语言模型让用户可以创建个性化的AI角色并与其交互。在ChatGPT引发全球AI热潮之前,Character.AI已经积累了庞大的用户群,并在2023年3月完成了a16z领投的1.5亿美元A轮融资,估值达到10亿美元。

那时的谷歌,还在用Bard来应对ChatGPT带来的舆论压力。


三、27亿美元的”回购”,和它没能买到的东西

2024年8月,事情发生了戏剧性的转折。

谷歌宣布与Character.AI达成合作协议:以27亿美元的费用获得Character.AI现有LLM技术的非独家使用授权,同时将Shazeer、De Freitas以及Character.AI的多名核心研究人员”接回”谷歌DeepMind。

这笔交易的结构经过精心设计:不是收购,而是许可协议。谷歌没有买下Character.AI这家公司,而是买下了其技术许可权,并且通过聘用协议让核心研发人员重返谷歌。Character.AI则保持独立,以这笔资金继续自己的产品发展。

华尔街日报后来把这笔交易描述为”谷歌付27亿美元把一个因挫败而离职的AI天才请回来”(Google Paid $2.7 Billion to Bring Back an AI Genius Who Quit in Frustration)。

从谷歌的角度看,这笔钱花得相当合算:它既拿到了Character.AI积累的技术资产,又把Transformer的共同作者、最具实力的AI研究者之一,从可能的竞争对手阵营里”买”了回来,同时让他在最重要的战略项目——Gemini大模型上担任联合负责人。

Shazeer回归后,谷歌在Gemini模型上的推进速度明显加快。2026年5月的谷歌I/O大会上,Gemini 3.5 Flash和Gemini Spark AI代理作为核心产品发布,被外界普遍解读为谷歌在AI竞争中重夺优势的重要信号。

但27亿美元只能买到时间,买不到一个人对某种组织文化的永久认同。

2年之后,合同没有续签。


四、这次,他去的是OpenAI

2026年6月18日,距离重返谷歌不到2年,Shazeer宣布加入OpenAI。

CNBC用了一个精准的标题:”Google Gemini co-lead Noam Shazeer leaves for OpenAI”。

这条消息的冲击力,需要几层背景来理解:

背景一:时机的讽刺性。谷歌I/O发布Gemini 3.5 Flash才过了几周——在那次发布上,谷歌展示了它在AI领域的重大进展,Shazeer也作为联合负责人站在了台前。产品刚发布,负责人就宣布离职,这种时间节奏本身就是一种表态。

背景二:OpenAI的IPO时机。就在Shazeer宣布加入的同一个月,OpenAI刚向SEC秘密递交了IPO申请。一家正在冲刺上市、试图向公众市场证明自身技术壁垒的公司,此时把谷歌Gemini的联合负责人招致麾下,不管是战略层面还是公关层面,都堪称妙手。

背景三:重复的选择逻辑。Shazeer不是第一次因为”谷歌速度太慢”而出走。他在Character.AI时期的公开表述,以及这次的跳槽方向,都在指向同一个结论:他需要的不是稳定和资源,他需要的是一个允许他以最快速度前进的环境。谷歌无法持续提供这种环境,不管给多少钱。


五、Transformer作者的迁徙地图,就是AI权力的流向图

2017年那篇”Attention Is All You Need”有8位作者。这8个人,今天分布在哪里?

这张”迁徙地图”已经成为AI行业观察者最喜欢追踪的话题之一。根据公开信息梳理:

  • Ashish Vaswani、Niki Parmar、Jakob Uszkoreit、Llion Jones:这4位共同作者在2022年联合创立了Adept AI Labs——一家专注于AI代理和工作流自动化的公司,目标是让AI模型能够直接操作计算机完成复杂任务。
  • Aidan Gomez、Nick Frosst:他们在2019年共同创办了Cohere,这家公司如今是企业级LLM服务领域的主要玩家之一,2023年估值超过21亿美元。
  • Illia Polosukhin:创办了NEAR Protocol,转向了区块链和Web3方向。
  • Noam Shazeer:创办Character.AI,被谷歌以27亿美元”买回”,现在加入OpenAI。

8位作者,8条不同的路径,没有一个人选择永久留在谷歌。

这张地图说明了一件事:最顶级的AI研究者,不是在谷歌、微软、Meta这些大公司里”成就”的——他们诞生于这些公司,但大多数人最终在这些公司之外,才开始形成独立的学术重力和产业影响。

对谷歌来说,这是一个结构性的、几乎无解的战略困境:它的规模、品牌和资源,能吸引最顶尖的人才;但同样的规模和品牌,也在不断制造那些逼走顶尖人才的组织结构问题。

27亿美元买回一个人两年,是谷歌能做到的极限。更长远的事情,它无法用钱解决。

更值得注意的是:这8个人创办或参与的公司,加上Shazeer加入的OpenAI,今天的合计估值已经超过了数百亿美元,覆盖了AI代理、企业LLM、社交AI、去中心化网络等多个方向。Transformer架构不是谷歌的竞争优势,它成了整个行业的地基——而这个地基的主要建筑者,都不在谷歌了。


六、对OpenAI意味着什么

Shazeer加入OpenAI,从战略层面来看,价值是多维的:

技术维度:Shazeer在Transformer架构上有无可替代的底层理解,在Gemini研发上的实战经验也让他对当前最先进模型的设计取舍有直接认知。他的加入,不管具体负责什么方向,都会对OpenAI的架构研究产生深远影响。

市场维度:OpenAI正在IPO前的关键窗口期,向潜在投资者展示技术壁垒是重中之重。Shazeer的背景和声誉,是任何PR材料都无法替代的信号——这不是招聘了一个好工程师,而是把AI研究圈里最具标志性的名字之一,写进了公司的技术团队列表。

竞争维度:这是一场关于认知战的信号发射。谷歌是OpenAI在AI领域最主要的竞争对手,而把谷歌Gemini的联合负责人招至麾下,向整个行业传递了一个明确的信息:OpenAI不只是在追赶,它已经成为最优秀的人才愿意主动选择的目的地。


七、不同的视角:这是谷歌的失败,还是AI行业的健康?

当然,这个事件也有值得反驳的解读。

乐观的读法:人才流动本身就是行业活力的体现。谷歌依然有世界级的AI团队,Gemini依然是最先进的模型之一。一个核心研究者的离开,不会打断谷歌的技术路径,它有足够的板凳深度来应对。况且,从产业生态的角度来看,顶尖人才在不同公司之间流动,有利于知识扩散和整体行业水平的提升。

悲观的读法:谷歌已经是第二次用高价请回同一个人,然后又第二次失去他。这个循环本身说明,谷歌在AI研究文化上存在深层的留人困境,而这个困境不是钱能解决的。当一个公司无法为最顶级的人才提供”足够快”的工作环境,它在AI竞争中的长期位置就会不断被侵蚀。

结构性的读法:这个故事的本质,不是谷歌输给了OpenAI,而是大型科技公司的组织惰性,在AI这个要求极致速度的领域里,正在成为它们最大的战略负担。谷歌有人才,有算力,有数据,有品牌——但它缺乏一种允许最激进的人才以最激进的方式前进的文化基础设施。这是规模的诅咒,也是谷歌内部无数优秀工程师都心知肚明的事。


八、尾声:AI历史不是在公司里写的,是在那些停不下来的人手里写的

谷歌在2004年发明了MapReduce,用它奠定了大数据时代的基础设施。但开源版本Hadoop在谷歌之外蓬勃发展,最终谷歌自己也转向了不同的架构,而MapReduce的生态在它的发源地之外繁荣壮大。

Transformer的故事,或许正在重演这个逻辑的变体:最重要的架构诞生在谷歌,但最重要的应用、演化和商业化,正在谷歌之外发生。

Noam Shazeer的迁徙,是这个逻辑最新的一个数据点。

他不是第一个这样的人,也不会是最后一个。但每一次这样的迁徙,都让我们更清楚地看到:AI的引力中心在哪里,谁在定义速度,谁在用规则管理速度,以及最终,历史会记住哪种选择。

2026年6月18日,这个引力中心又移动了一点点。方向是OpenAI。

但这里有一个值得玩味的问题:OpenAI现在也要IPO了。它也会成为谷歌吗?

当一家公司上市,当它的股东结构变得复杂,当安全合规的压力开始积累,当内部资源争夺开始取代外部竞争作为主要摩擦来源——那些现在选择OpenAI的人,会不会在5年后再次出走?

这不是要预言OpenAI的命运,而是在说:在AI这个领域,”速度”和”规模”之间的张力,是一个永恒的命题。Transformer的8位作者用各自的选择回答了这个命题;Shazeer今天的决定,只是这个答案里的最新一句。

下一句,已经在路上了。


参考资料

  1. CNBC, “Google Gemini co-lead Noam Shazeer leaves for OpenAI”, June 18, 2026: https://www.cnbc.com/2026/06/18/google-gemini-co-lead-noam-shazeer-leaves-for-openai.html
  2. Noam Shazeer, post on X, June 18, 2026: https://x.com/noamshazeer/status/2067400851438932297
  3. CNBC, “Ex-Google engineers from Character.AI rejoin company with new AI partnership”, August 2024: https://www.cnbc.com/2024/08/02/ex-google-engineers-from-characterai-re-join-company-with-ai-partnership-.html
  4. Vaswani et al., “Attention Is All You Need”, NeurIPS 2017: https://arxiv.org/abs/1706.03762
  5. Wikipedia, “Noam Shazeer”: https://en.wikipedia.org/wiki/Noam_Shazeer
  6. CNBC, “OpenAI confidentially files for IPO”, June 2026: https://www.cnbc.com/2026/06/08/openai-confidentially-files-for-ipo-prepping-wall-street-for-ai-debut.html
  7. CNBC, “Google unveils Gemini 3.5 Flash and Gemini Spark at Google I/O 2026”, May 2026: https://www.cnbc.com/2026/05/19/google-ai-ultra-gemini-spark-omni.html