5个月估值涨160%：Baseten的15亿美元融资，以及「推理层」成为AI下一个兵家必争之地的真相

2026年1月，Baseten完成了3亿美元C轮融资，估值50亿美元，被认为是AI推理赛道当时最大的一笔融资。

2026年6月，仅仅5个月之后，Baseten正以130亿美元的估值，接近完成新一轮15亿美元融资。

从50亿到130亿，估值增长160%。从3亿到15亿，融资规模增长400%。

这组数字，是理解2026年AI基础设施投资逻辑最好的一把钥匙。

什么是推理，为什么推理变得值那么多钱

要理解Baseten的价值，先要理解”推理”（inference）在AI产业链中的位置。

一个AI模型的完整生命周期，分为两个主要阶段：训练（training）和推理（inference）。

训练是一次性的、高度资本密集型的工作：你需要大量GPU，用海量数据”教”模型学会某种能力。这个阶段的主角是Nvidia的H100/B200，是Amazon、Google、Microsoft的大型数据中心集群，是OpenAI、Anthropic花费数十亿美元”制造”模型的过程。

推理是每次用户使用AI时都会发生的事情：用户输入一个问题，模型处理并输出答案。这个过程可能只需要0.1秒，但它每天发生数十亿次。对每一个拥有真实用户的AI应用来说，推理成本是最大的持续性开销，也是决定商业可持续性的核心变量。

长期以来，推理被认为是AI产业链的”管道”——重要但不性感，像水电一样不可或缺但很难产生高估值。这个认知，在2025年底和2026年迅速改变。

改变的原因，来自两个同时发生的趋势。

推理市场爆炸的两个驱动力

驱动力一：推理量的指数级增长

Baseten在其Series E公告中披露了一个令人咋舌的数字：在过去一年，其平台上的推理量增长了100倍。

不是100%，是100倍。

这一数字的背后，是AI模型从”技术圈产品”向”大众消费品”的渗透加速。ChatGPT、Claude、Gemini的用户数量迅速增长，每个用户的每一次对话，都是一次推理。企业级应用的部署量同样在爆炸性增长——越来越多的公司在其产品内嵌AI能力，每天产生的推理量，是两年前无法想象的规模。

预测未来的增长轨迹，一个关键变量来自推理密集型应用的崛起：具有思维链的推理模型（如o3、Claude Sonnet的extended thinking模式）需要比传统对话模型多出10-100倍的计算量才能完成一次响应。随着这类模型被嵌入越来越多的应用，推理总量将呈现更陡峭的增长曲线。

驱动力二：开源模型爆炸创造的多模型路由需求

过去18个月，AI模型生态发生了根本性的结构变化：高质量的开源模型，从稀缺品变成了标准配置。

DeepSeek-V3、DeepSeek-R2、Meta的Llama系列、Qwen系列、Google的Gemma，还有小米MiMo、Minimax等中国公司的模型，构成了一个庞大的、持续扩充的开源模型库。这些模型在性价比上已经能够与闭源顶级模型正面竞争——用Baseten自己的话说，他们的价值就是”路由请求到最适合任务的模型，尤其是有竞争力的低价开源替代方案”。

这种多模型生态，对企业用户来说是一个机遇，但也是一个管理挑战：在数十甚至数百个可用模型中，怎么知道该用哪个？如何确保延迟、吞吐量、成本和质量的最优配置？如何在模型不可用时自动切换？

这正是Baseten的价值主张：成为企业AI推理的智能路由层和管理平台，让企业不需要关心底层是哪个模型，只需要关心他们的业务目标。

Baseten的客户名单：AI行业最快速增长公司的共同基础设施

Baseten的成立于2019年，彼时”AI应用层”这个概念几乎不存在。其创始人的核心信念是：未来将会有无数专门化的模型在生产环境中大规模运行，而快速、可靠、安全的推理服务，将成为连接AI潜力与真实世界影响的关键环节。

这个预判在2026年已经得到了充分的市场验证。Baseten的客户名单，几乎是一张当下AI应用层最重要公司的清单：Abridge（医疗AI转录）、Clay（销售AI工具）、Cursor（AI编程助手）、OpenEvidence（医学AI）、Mercor（AI人才匹配）、Notion（AI协作工具）。

这些公司的共同特点：都有真实的生产环境用量，都对推理延迟和可靠性有极高要求，都需要在多种模型之间灵活切换。他们需要的，不是一个”租GPU”的服务，而是一个能帮助他们最优化AI服务交付的合作伙伴。

Cursor的存在格外值得关注。Cursor已经成为全球最广泛使用的AI编程工具之一，其背后的AI推理需求极为可观——每次代码补全、每次对话，都是一次推理事件。Baseten能够成为Cursor的推理合作伙伴，本身就是对其能力的最有力背书。

分拆定价（Split-Priced Round）：一种正在蔓延的AI融资新病

Baseten这笔融资还有一个值得深究的技术细节：这是一笔分拆定价轮（split-priced round）。

根据TechCrunch引用的WSJ报道，这笔15亿美元的融资中，部分投资人以13亿美元估值进入，另一部分投资人以11亿美元估值进入。投资者在同一轮融资中以不同价格购买同一家公司的股权。

这种结构，在2026年的AI融资市场中越来越普遍。其背后的逻辑是这样运作的：

对初创公司而言，分拆定价允许他们以”领投方认可的最高估值”作为公关标题（13亿美元），同时为后续跟投者保留了以较低估值参与的空间（11亿美元）——让更多机构愿意参与，同时不让任何一方觉得自己买贵了。

对投资者而言，11亿美元估值进入的机构，相当于在同一标的上”打折购入”，天然获得了相对于13亿美元进入者更好的回报空间。

对市场信号而言，分拆定价也在某种程度上反映了市场对AI估值的不确定性：投资者认可标的的价值，但对于”应该值多少”存在分歧。13亿与11亿之间15%的差距，就是这种不确定性的定价。

TechCrunch早在三月份就分析了这一趋势，指出AI独角兽越来越多使用分拆定价来推高估值头条，同时为不同类型的投资者提供差异化的进入条件。Baseten的案例，是这一趋势在最优质的AI基础设施标的上的最新演示。

从150M到1.5B：12个月内的三次融资加速度

Baseten的融资历史，用几个节点勾画出了AI推理市场增长的温度计：

2025年9月：1.5亿美元D轮，估值未完整披露（参考TechCrunch报道）
2026年1月：3亿美元E轮，估值50亿美元，由IVP和CapitalG领投，NVIDIA参投
2026年6月：约15亿美元新轮，估值约130亿美元（部分投资人），由Spark Capital、Sands Capital、Altimeter Capital和Wellington Management共同领投

从1.5亿到3亿到15亿，单次融资规模在12个月内增长了10倍。从50亿到130亿，估值在5个月内增长了160%。

这种加速，反映的是市场对”推理层将在AI价值链中占据更核心位置”这一判断的越来越强烈的共识。

当模型本身的能力差异正在缩小，当开源模型的质量不断提升，当Claude和GPT-4o之间的差距对90%的任务来说已经可以忽略——谁能最高效地交付这些模型的能力，谁能在延迟、成本、可靠性上做到最优化，就成了真正的竞争分水岭。

Baseten的投资人，正是在押注这个答案。

推理市场的竞争格局：为什么不是赢家通吃

在讨论Baseten的增长逻辑时，一个不可回避的问题是：推理市场会不会最终像搜索、社交网络一样出现赢家通吃？

目前的答案是：不太可能，至少不会像那些行业一样快速集中。

推理市场的结构，有几个因素天然不利于过度集中：

碎片化的需求：不同应用对推理服务的需求差异极大。实时语音AI需要超低延迟，批量数据处理可以容忍高延迟但要求低成本，安全敏感应用需要私有化部署，全球产品需要多地域覆盖。没有一个服务商能以同样的方案优化所有需求，这为多家专业化提供商留出了生存空间。

开源模型的去中心化效应：随着越来越多的高质量开源模型出现，任何一家推理服务商都可以在其平台上集成和优化这些模型。这使得差异化竞争点，从”独家模型访问权”转移到了”服务质量”——而后者更难形成垄断。

云服务商的直接竞争：AWS、Google Cloud、Azure都在构建自己的托管推理服务，这些巨头的参与，会在高端企业市场形成强大的竞争压力。专业化的独立推理平台，需要在速度、灵活性、专业化服务上找到与巨头的差异化空间。

这意味着推理市场更可能呈现出一种寡头竞争格局，而非单一垄断——几家大型平台主导，围绕它们形成一个由专业化推理服务商构成的生态。Baseten的雄心，是成为这个寡头格局中的核心玩家之一。

当模型价格趋近于零：谁在守住AI价值链的最后防线

放在更宏观的产业视角下，Baseten的故事揭示了AI产业链一个正在发生的根本性重塑。

历史上，IT行业每次出现大规模的底层技术商品化，都会催生一波基础设施层的超高价值公司。Linux商品化了操作系统，创造了Red Hat等基础设施公司的机会；硬件商品化创造了亚马逊AWS和Salesforce的机会；Android商品化了智能手机操作系统，把价值推向了应用层和服务层。

AI模型的商品化，正在遵循同样的历史规律。当模型本身不再是稀缺品，API价格持续下降，开源模型质量不断提升，价值正在从”谁拥有最强模型”转移到”谁能最优化地交付这些模型的能力”。

推理服务层，正在成为这次价值重新分配的核心受益者。Baseten的15亿美元融资，是资本市场对这一判断的最明确投票。

对于AI产业的参与者来说，这个信号意味着：未来三年，AI的核心竞争力，可能不再是你用的是哪个模型，而是你用多少钱获得了多好的推理服务。而在这个新的竞争维度上，Baseten正在努力成为答案。

从Baseten看AI基础设施投资的三个必要条件

Baseten的成功融资，并非仅仅因为赛道热，也来自其本身具备了AI基础设施投资中最关键的三个特质，这三个特质值得所有关注AI赛道投资者和创业者深思。

第一个特质：平台粘性高，切换成本真实存在。 AI模型可以随时被替换（这正是开源时代的特征），但推理平台不容易被替换。一旦企业将其推理基础设施、监控工具、自动扩容逻辑、模型路由规则全部托管在某个平台上，迁移成本会随着业务规模增长而快速升高。Baseten在Cursor、Notion这类高增长产品上建立的深度关系，是最强的护城河来源之一。

第二个特质：网络效应来自数据积累。 随着在Baseten平台上路由的推理请求数量增长，Baseten积累了关于不同模型在不同任务、不同延迟要求、不同成本约束下表现的大量数据。这种”路由智能”是一种来自规模的数据飞轮——平台越大，路由越智能，客户体验越好，吸引的客户越多。新进入者无法在没有历史数据的情况下复制这种优势。

第三个特质：商业模式与AI行业整体增长对齐。 Baseten的收入来自客户的推理量，这意味着Baseten的增长曲线天然与整个AI应用层的增长曲线挂钩。它不是在押注某一家模型公司会赢，也不是在押注某一种应用场景会爆发，而是在押注整个AI推理市场的体量增长——这是一种更宽泛、更不依赖单一判断的增长逻辑。

这三点，共同构成了为什么Baseten在模型层竞争极度激烈的时代，依然能够获得市场对其超高估值的认可。

DeepSeek与Baseten：一枚硬币的两面

最后，有一个值得单独指出的深层联系：Baseten的崛起与DeepSeek在美国的渗透，看上去是两件独立的事情，实际上是同一个故事的两面。

DeepSeek以极低价格提供高质量开源模型，让越来越多的企业开始认真考虑多模型策略——不再把Anthropic或OpenAI当作唯一选项，而是寻找”什么任务用什么模型最经济”的最优答案。这种多模型需求，恰恰是Baseten这类推理路由平台的最大商业机会。

换句话说，DeepSeek正在为Baseten创造市场。当美国用户开始因为价格差距而真正认真对待开源模型，他们需要的，不只是DeepSeek的API密钥，他们需要的是一套能帮助他们在Claude、GPT-4o和DeepSeek之间智能路由、管理成本的基础设施。

这就是为什么Baseten的融资，与DeepSeek的渗透，在同一时间窗口都在加速。它们是同一场AI商品化趋势中，两个不同层次上的受益者——一个在模型层，一个在服务层。

当整个AI产业从”谁的模型更强”进化到”谁能最优化地使用最合适的模型”，推理服务层的价值就不再只是管道，而变成了大脑。

Baseten正在押注，这个大脑，价值130亿美元，还只是一个开始。

推理服务行业的成本结构与盈利路径

任何高估值的科技公司，最终都需要回答一个问题：你的商业模式可以盈利吗？对于推理服务商而言，这个问题的答案取决于三个维度的平衡：算力成本、定价策略和规模效应。

算力成本是推理服务商最大的变量。推理需要GPU——H100、A100，或者更新的B200。这些芯片的租用成本，直接决定了提供推理服务的底线成本。当前，GPU云服务的价格在不断压缩，一方面是因为AMD和Intel在追赶Nvidia，另一方面是因为各大云服务商在内部算力资源上的自给比例不断提升。对于专业推理服务商来说，采购成本的控制，是比功能创新更关键的护城河之一。

定价策略方面，Baseten的模型与其他SaaS工具类似：按使用量（Token数）收费，对高吞吐量客户提供折扣，对需要专属资源的企业提供专有部署方案。随着客户规模增长，单位边际成本下降，毛利率理论上应当随规模扩大而改善。

规模效应在推理业务中，以一种并不总是直观的方式体现。随着平台上的请求量增大，Baseten可以更有效地进行批处理（batching），让多个请求共享同一次GPU计算，从而降低每次请求的实际成本。这种批处理优化，在小规模时效果有限，但在亿级请求量时，能够带来显著的成本效率提升。

12个月内推理量增长100倍，意味着Baseten如果未来12个月保持类似的增速，规模效应将开始真正显现。从50亿到130亿的估值提升，部分反映的就是市场对这种规模效应的预期定价。

AI基础设施投资的「黄金铲」逻辑正在深化

在19世纪加利福尼亚的淘金热中，真正稳定赚钱的，不是大多数淘金者，而是卖铲子给他们的人。这个”卖铲子”的比喻，在AI时代被反复引用——来解释为什么云基础设施和AI工具公司往往比模型公司更稳定地获利。

但2026年的AI推理层，正在将这个逻辑推进到第二阶段：不只是”卖铲子”，而是”运营黄金矿山”。

Baseten不是简单地向企业出售一个GPU访问接口，而是在构建一套完整的推理运营系统——包括自动扩容、模型路由、延迟优化、成本监控、故障切换。这更接近于一个”托管的推理运营商”，而非单纯的基础设施租用商。

这种定位的含义，是Baseten在争夺的不是基础设施市场的价格战份额，而是企业AI运营层的外包市场。当越来越多的公司认识到，维护一套企业级AI推理基础设施需要大量的专业工程人力，将这部分能力外包给专业服务商，在经济账上往往更合理——就像二十年前很多公司选择不自己建数据中心一样。

这是Baseten的最终商业故事：成为AI时代的AWS，不是售卖算力，而是售卖运营AI能力的基础设施。从这个角度看，130亿美元的估值，或许不是终点，而是起点。

参考资料:

TechCrunch, “AI inference startup Baseten reportedly raising $1.5B months after its last mega-round,” Jun 18, 2026 — techcrunch.com
Baseten官方博客, “Announcing Baseten’s $300M Series E,” Jan 2026 — baseten.co
TechCrunch, “Why AI startups are selling the same equity at two different prices,” Mar 3, 2026
Wall Street Journal, “The $13 Billion AI Startup Betting on Cheaper Alternatives to OpenAI, Anthropic,” Jun 2026 (via TechCrunch)