2026年6月2日,旧金山,Microsoft Build 2026大会主题演讲。

Mustafa Suleyman走上台,做了一件微软从未做过的事:他宣布微软将与OpenAI和Anthropic直接竞争

不是”增强合作”,不是”差异化定位”——是正面竞争。

“我们的目标,”Suleyman对着台下数千名开发者说,”是成为全球排名前4的AI研究实验室之一。”

这句话,在过去7年里,微软从来没有说过。

在此之前,微软的AI战略建立在一个清晰的分工逻辑上:微软做基础设施和应用层(Azure、Office、Teams),OpenAI做模型研究。微软投入了超过130亿美元,换取了OpenAI约49%的利润份额和Azure的独家模型使用权。这是一笔历史上最成功的科技风险投资之一——但它的代价是:微软的AI智能核心,从来都不在自己手里

现在,这一切正在改变。


一个模型,7款发布,1条清晰的独立宣言

Build 2026大会上,微软一口气发布了7款自研AI模型,统称MAI(Microsoft AI)家族。

旗舰是MAI-Thinking-1:350亿活跃参数,256K上下文窗口,定位为企业级推理模型。围绕它的还有:MAI-Image 2.5(图像理解)、MAI-Voice-2(语音)、MAI-Code-1-Flash(代码,已集成GitHub Copilot和VS Code),以及另外3款覆盖不同企业场景的专项模型。

这次发布的重点不是数量,而是MAI-Thinking-1承载的技术宣言

微软特别强调了3件事:

第一:MAI-Thinking-1从零训练,完全不依赖蒸馏。

在AI模型领域,”蒸馏”(distillation)是一种常见的捷径——用大模型的输出来训练小模型,以更低成本获得接近的能力。Google的大量小模型、许多开源模型,都不同程度地使用了蒸馏技术。它高效,但存在一个深层限制:蒸馏出来的模型,能力上限被”老师模型”锁定了。你可以蒸馏出接近Claude Opus 4.6的小模型,但你永远无法蒸馏出超越Claude Opus 4.6的模型。

微软明确声明,MAI-Thinking-1的训练数据来自真实人类知识和模型自主探索,没有依赖任何第三方模型的输出。用Suleyman的话说:这是”一台爬山机器(hill-climbing machine)”,通过自主迭代提升能力,每一次迭代都在向更高的山顶攀登。它走的是一条独立发现的路径,而不是别人已经走过的路。

这个声明的含义,远比它表面上看起来更深远:它意味着MAI的能力上限,理论上是开放的,不被任何外部模型所约束。

第二:MAI-Thinking-1在多个关键基准上超越了Claude Sonnet 4.6,并与Claude Opus 4.6持平。

根据微软发布的内部评测,在盲测(human-blind evaluation)中,MAI-Thinking-1的整体表现优于Claude Sonnet 4.6。而在SWE Bench Pro——目前公认最严苛的软件工程基准之一,要求模型真实解决GitHub issue——MAI-Thinking-1的得分与Claude Opus 4.6持平。

这意味着什么?Claude Opus 4.6是Anthropic目前最强的旗舰模型,是企业市场最受认可的”顶级推理能力”代表。能与之持平,意味着微软自研的推理模型,已经进入了Anthropic最高端产品线的竞争区间——那是此前微软从未真正涉足过的领域。

对企业用户来说,这个评测结果的影响是立竿见影的:在采购AI模型服务的对话里,”Claude Opus 4.6”不再是唯一的顶级选项了。

第三:MAI-Thinking-1的定价低于OpenAI和Anthropic的同类产品。

微软官方确认,MAI系列模型的定价策略是”低于OpenAI同类产品”。这不是一个偶然的决策,而是一个明确的市场攻势信号:微软在向企业用户发送一条清晰的消息——选择MAI,你将获得可与顶级模型媲美的能力,并支付更少的成本。

价格+性能的组合,在企业采购中是最难抗拒的论点。


分手之后:微软与OpenAI的关系重塑

要理解这次发布的意义,必须先理解它发生的背景。

2026年初,微软与OpenAI重新谈判了长达数年的商业协议。具体条款没有完全公开,但已知的关键变化是:微软不再向OpenAI支付收入分成,而OpenAI获得了跨云提供服务的自由

表面上看,这是一次互利的松绑:OpenAI可以在AWS和Google Cloud上提供服务了,不再受Azure独家限制;微软则摆脱了收入分成的财务负担,以及随之而来的对OpenAI产品路线图的部分依赖。

但在战略层面,这次重组意味着一个更根本性的转变:微软和OpenAI,从此前的”战略伙伴”变成了”同台竞争的对手”。

Suleyman承认了这个现实,但他的表述耐人寻味:

“关键的转折点,是我们与OpenAI重新谈判了合同。”

这句话里有一种冷静的自信。他没有说这是一次艰难的决定,没有掩饰竞争的事实,也没有用”各有侧重”的外交辞令来淡化分歧。他用一种平静的、几乎是商业分析式的语气,描述了这件事:解绑是正确的,这让微软可以真正建立自己的AI能力,而不是在别人的研究上构建一个永远面临替换风险的上层建筑。

从历史角度看,这种转变的时间节点颇具意味。

2019年,微软以10亿美元首次投资OpenAI时,外界普遍认为这是一笔”聪明的风险押注”——AI未来可能很重要,而OpenAI看起来比较靠谱,投进去试试。2021年再投15亿,2023年追加100亿,2025年又注入一批资金,累计超过130亿美元。每一笔追加投资,都伴随着更深的依赖:微软的AI路线图和OpenAI的研究方向深度耦合,Azure的竞争优势建立在GPT系列的独家访问权上,Copilot的核心能力依赖OpenAI的Codex。

现在,微软用Build 2026告诉市场:这个阶段结束了

不是背叛,不是决裂——但确实是转折。微软选择了一条更艰难但更安全的路:自己建模型,自己掌控智能核心,然后再根据市场需求决定是否继续使用或整合第三方模型。

这种战略转变,在科技史上有一个经典的先例:2005年前后,苹果从Intel处理器全面转向自研Apple Silicon。那次转变的逻辑完全一致:与其永远依赖别人的芯片路线图,不如自己做,自己控节奏,自己决定架构方向。结果是什么,今天已经有目共睹。


不只是模型:Build 2026的完整战略图景

如果单独看MAI-Thinking-1,它是一款令人印象深刻的模型发布。但把它放在Build 2026整个发布矩阵里看,会看到一个更野心勃勃的战略图景——微软正在系统性地重建整条AI价值链。

Copilot超级应用

微软将Copilot重新定位为一个”超级应用”——不只是嵌入Office的AI助手,而是一个可以连接用户所有工作场景的统一界面。这是直接对标OpenAI的ChatGPT和Anthropic的Claude.ai的产品形态。但微软的Copilot有一个OpenAI和Anthropic都难以复制的优势:它可以天然地访问用户在Microsoft 365生态里的所有数据——电子邮件、日历、文档、Teams聊天记录——而不需要用户额外授权或数据迁移。这是一种对企业用户极其深入的”数据锁定”,也是一种极难被竞争对手复制的护城河。

Scout:永远在线的个人Autopilot Agent

这是Build 2026中最具未来感的发布之一,也是最接近”AGI助手”概念的产品构想。

Scout被定义为一款”Autopilot”模式的个人AI Agent——用户不需要每次手动激活,它持续在后台观察用户的工作模式,主动识别待处理任务,在用户不在时代为完成特定工作,并在需要确认时以最少打扰的方式介入。

这个定位,与Anthropic正在测试的Claude持久记忆系统和OpenAI的operator模式,共同指向了同一个未来愿景:AI助手从”工具”进化为”协同工作者”,从”被呼唤”进化为”主动参与”。但Scout的差异在于它的触点密度:它建立在Windows操作系统层面,可以感知用户所有本地应用的状态,这是基于网页或API的AI助手无法获得的信息密度。

MDASH网络安全工具

100个AI Agent协同工作,自动扫描企业系统漏洞,生成修复方案,并追踪修复进度。

这不只是一个安全产品,它是微软向企业展示的一个”多Agent协作解决复杂生产问题”的真实落地案例。在AI Agent应用领域,从理论到实际生产的落地案例依然极其稀缺。MDASH提供了一个具体的、可验证的参考——不是概念演示,而是企业级安全场景下的实际部署。

MAI-Code-1-Flash与GitHub Copilot的完全整合

这是所有发布中对微软商业护城河最直接的一次强化。

GitHub Copilot已经是微软最成功的AI产品之一,截至2026年初的年营收估计超过12亿美元。它的核心是代码生成能力,而代码生成能力过去依赖的是OpenAI的Codex模型。

现在,MAI-Code-1-Flash已经完全集成进GitHub Copilot和VS Code。这意味着:GitHub Copilot的核心能力不再依赖OpenAI,整条产品价值链完全内部化——从模型训练到API服务到应用分发到企业销售,全部在微软自己的生态内完成。

竞争对手想要复制这条价值链,需要同时拥有:能力媲美的模型 + 覆盖全球数千万开发者的代码工具产品 + 完整的企业销售网络。这是一个几乎不可能在短期内被匹敌的组合。


Anthropic和OpenAI的真实处境

从Anthropic和OpenAI的角度来看,Build 2026意味着什么?

对OpenAI而言,失去微软的独家庇护,是一次战略上的双重代价支付:首先,Azure不再是GPT系列进入企业的专属分发通道,OpenAI必须在AWS和Google Cloud上自建关系;其次,GitHub Copilot——微软AI生态里最重要的开发者入口——的核心模型从Codex切换到了MAI-Code-1-Flash,OpenAI失去了这个流量和曝光来源。在消费者市场,ChatGPT依然是大众用户心目中的第一选择;但在企业市场,OpenAI历来最依赖微软渠道,如今这条渠道正在被微软自己的产品替代。

对Anthropic而言,局面更为微妙,也更值得关注。

在Claude Code市场,Anthropic一度遥遥领先于竞争对手。CNBC在2026年6月的报道提供了一组令人惊讶的数据:Claude Code的企业营收已经超过了OpenAI的Codex,尽管用户总数只是对方的零头。这种”人少但质量高”的企业客户结构,表明Anthropic在一部分愿意为顶级代码质量付出溢价的企业用户中,建立了相当强势的地位。

但MAI-Code-1-Flash的出现,开始在这个市场制造侵蚀。

微软不需要说服企业客户”主动放弃Claude Code,改用MAI”——它只需要在现有GitHub Copilot的月付订阅里,提供一个对比测试界面,让企业IT部门自己看数据做决策。面对”差不多的能力 + 微软原生支持 + 更低价格 + 不需要更换供应商”这个组合,大多数企业的采购流程会输出一个可预测的结论。

更关键的是MAI-Thinking-1在SWE Bench Pro上与Claude Opus 4.6持平的评测结果。

Anthropic的定价体系建立在”Claude Opus系列是顶级推理能力的代名词”这个假设上。当市场上出现一个”差不多的推理能力 + 更低价格 + 更强的企业生态整合”的替代方案,那个定价假设的基础就开始松动了。

这对Anthropic即将进行的IPO是一个重要的不确定因素。Anthropic的S-1估值接近1000亿美元,核心论点是”Claude是企业级AI的顶级选择,护城河来自能力领先和安全声誉”。

但这里需要做一个重要的区分:模型能力的趋同,并不等于企业信任的趋同

Anthropic在过去3年里建立的,不只是”更好的模型”,还有一套完整的企业AI可信框架——Constitutional AI、可解释性研究、安全承诺(RSP)、以及在金融、医疗、政府等高合规行业的深度部署经验。这些资产,不会因为MAI-Thinking-1在SWE Bench Pro上追上Claude Opus 4.6而消失。

对于那些选择Anthropic的企业客户,价格和能力只是部分因素,另一部分是”我相信这家公司在AI安全上的判断”——这是一种需要多年积累才能建立、并不容易被技术追平的信任资本。

真正的问题是:这种信任资本,能否在MAI持续迭代、价格持续下压的竞争压力下,继续支撑Anthropic所期望的溢价?这是投资者在评估Anthropic IPO时必须面对的核心问题,目前答案并不清晰。


“爬山机器”的哲学:微软AI战略的深层逻辑

Suleyman在Microsoft AI官方博客里发布的文章标题是:《Building a Hill-climbing Machine》(构建一台爬山机器)。

这个比喻值得认真对待。

爬山算法(hill climbing)是优化理论里一个最朴素的概念:观察当前位置,找到所有邻近方向中最优的那个,向那个方向走一步,然后重复这个过程。它不是最聪明的算法——它可能陷入局部最优,它看不到全局地形,它无法一步跨越深谷直达全球最高点。但它是最稳健的算法之一:它永远在进步,每一步都有可验证的提升,它不会在寻找”最优解”的过程中倒退或停滞。

这个比喻精准地描述了微软在AI领域的长期战略姿态:

不追求单次颠覆性突破,而是系统性、持续性的迭代。不依赖外部能力的注入,而是建立内部自我提升的循环。不以”最先到达山顶”为目标,而是以”每天都比昨天更接近山顶”为准则。

这种战略的深层优势是什么?

它极难被打败,因为它消除了”创新失败”这个最大的风险

要打败一家追求”最快到达山顶”的公司,你只需要比它更快,或者走一条它没走的路。但要打败一家”每天都在系统性爬升”的公司,你必须保证自己也在每天以更快的速度爬升——而且这个状态要永久维持,没有停歇,没有失误。这是一个指数级更高的要求。

回头看微软过去30年的企业市场统治史,这种”爬山机器”的逻辑贯穿始终:Windows不是第一个图形操作系统,但它是迭代速度最快的那个。Office不是最早的办公套件,但它把”每个版本都比上一个版本更好用一点”这件事做了30年。Azure不是云计算的发明者,但它用持续的功能扩展和企业信任积累,追上了AWS并威胁Google Cloud的地位。

MAI是这个模式在AI时代的延伸。


一个分水岭时刻,以及它对整个行业意味着什么

回顾AI行业的发展历史,有几个分水岭时刻改变了整个格局:

2022年11月,ChatGPT的发布,让AI从研究社区的讨论对象变成了大众消费产品,触发了全球科技行业的AI转型加速。

2023年3月,GPT-4的发布,将AI能力提升到了企业生产可用的新水准,触发了全球企业AI采购的第一波高潮。

2024年底,Claude 3.5 Sonnet的发布,证明了开放市场上可以存在真正意义上与OpenAI竞争的独立AI研究力量,Anthropic从”安全驱动的小众实验室”变成了企业用户心目中真正的第二选项。

2026年6月,Build 2026是另一个分水岭。它的意义不在于某款具体模型的能力提升,而在于:全球最大的企业科技公司,宣布加入顶级AI模型的竞争,并且带着完整的产品矩阵、分发网络和资金实力入场

这改变了竞争的维度。

在此之前,顶级AI模型竞争的参与者是:OpenAI、Anthropic、Google DeepMind、Meta,以及Mistral等规模较小的独立实验室。它们的竞争是一场”最强研究能力”的争夺——谁的模型更聪明,谁的训练方法更高效,谁的安全对齐做得更好。

微软入场之后,新增了一个此前任何玩家都不具备的组合:全球最大的企业软件销售网络 + 世界级云计算基础设施 + 前沿AI研究能力 + 覆盖超过10亿用户的产品矩阵 + 不需要靠模型盈利来养活公司的财务结构(Windows和Office已经足够)

这最后一条尤其值得注意。Anthropic和OpenAI必须靠模型API收入来支付训练成本、工程师工资和基础设施费用——这意味着它们的定价不能低过成本线。微软则不然:MAI的训练成本可以被计入”产品研发”,而不需要在模型API定价上直接回收。这给微软提供了一个几乎无限的定价弹性,可以在短期内把MAI定价为”接近成本”,同时用Copilot订阅和Azure消费来实现商业化。

这不是说微软一定会赢——AI竞争的结果远未决定,能力差距、用户习惯、品牌信任都是关键变量。但它意味着,这场竞争的难度,从今天起,对所有人都提高了一个量级。

对Anthropic和OpenAI来说,Build 2026不只是一场发布会,而是一个信号:最强的企业科技平台,刚刚决定自己下场了。而且,它带来了所有必要的武器


写在最后

2019年,微软首次向OpenAI投资10亿美元时,内部有一个共识:AI将改变一切,但谁最终会赢还不确定,最好的策略是押注最有可能赢的那支队伍。

2026年,这个逻辑已经改变了。

微软不再只是押注别人——它开始押注自己。

在”爬山机器”的背后,是微软对AI未来的一个判断:模型能力最终会商品化,真正的竞争优势将来自模型与产品、云基础设施、企业服务的深度整合。而那种整合能力,微软比任何人都更擅长,积累的时间也最长。

MAI-Thinking-1不只是一款推理模型。它是一句宣言:微软正在重新定义自己在AI时代的角色,从”最聪明的整合者”变成”有自己智能核心的原创者”。

这个转变,将是未来3年AI商业格局演变最重要的变量之一。因为它意味着,AI行业第一次有了一个拥有完整能力图谱的”全场选手”——不只是顶级的研究能力,不只是顶级的应用,不只是顶级的分发,而是把这三者放在同一家公司里,并且这家公司已经在企业市场建立了超过三十年的信任。

这对整个行业来说,是一个全新的竞争局面。它将加速部分赛道的商品化(如代码生成),但也会催生新的差异化空间(如主动Agent、垂直领域的深度整合)。对创业公司来说,与其在微软已经建立了护城河的领域正面竞争,不如找到那些微软的”爬山”动作还没有覆盖到的山头,在那里率先建立根据地。

这是AI时代创业者和战略决策者最需要思考的新现实。


参考资料