当AI编程爆发,谁在解决「算力这件脏活」

想象这样一个场景:2026年,一位AI工程师用Claude Code生成了一段批量处理百万张图片的Python脚本,15秒。然后他打开终端,想把这段代码部署到云端100个GPU并行运行——这个过程,在传统云环境里至少需要:配置VPC、申请GPU实例、写容器化脚本、处理依赖安装、配置自动伸缩、处理实例失败重试……可能整整一天。

Modal Labs在做的事情,是把这”整整一天”,压缩到3行Python代码的变化。

2026年5月21日,Modal Labs官方博客宣布完成3.55亿美元Series C融资,估值46.5亿美元。本轮由General Catalyst和Redpoint领投,Menlo Ventures、Bain Capital Ventures、Accel作为新投资方加入,所有现有主要投资方追加投资。

同一天,Reuters也报道了这一消息,并披露了一个关键财务指标:Modal年化营收已超过3亿美元,自2025年9月以来增长5倍。

消息本身,并不令人特别意外——在AI基础设施赛道,大额融资几乎每周都在发生。

但Modal Labs这笔融资背后的叙事,比一般的”又一家AI公司拿到钱”要有意思得多。


从0到10亿个沙盒:一个令人惊讶的里程碑

Modal在官方博客里公布了一个数字,让许多人震惊:自2023年推出沙盒环境(Sandboxes)功能以来,Modal平台累计启动了超过10亿个AI沙盒实例。

10亿,这不是一个小数字。

沙盒(Sandbox),是Modal为AI Agent和AI辅助编程设计的核心功能:一个隔离的代码执行环境,让AI生成的代码可以在安全隔离的环境中立即运行,而无需开发者配置任何基础设施。每次AI代理需要执行Python代码、每次AI工具需要验证生成的逻辑、每次机器学习实验需要在独立环境中跑——都会启动一个沙盒。

数字本身的意义在于:它印证了一个趋势——AI生成代码、然后立即在云端执行,已经从”有趣的工具”变成了开发者日常工作流的一部分。每次有人用Cognition的AI代理、每次Ramp的工程师让AI写合并请求、每次DoorDash的商家配置AI代理管理库存……背后都可能有一个Modal Sandbox在运行。

更重要的是:10亿这个数字,意味着Modal已经积累了大量用于优化调度算法的实际运行数据。什么样的任务需要什么样的GPU配置?哪些Python依赖库最常被使用(可以预构建缓存)?不同地区的GPU供需在什么时间段最紧张?这些数据,是Modal调度系统不断自优化的原材料,也是竞争对手无法简单复制的核心资产。

这10亿个沙盒,是Modal业务增长5倍的底层技术驱动力,也是它护城河的最有力证据。


客户怎么说:Cognition、Ramp、DoorDash、Decagon

Modal博客里罕见地收录了多个核心客户的直接引用,这些数字和评价提供了难得的一手信息:

Cognition(AI编码代理):CEO Scott Wu表示,”Modal支持我们的强化学习基础设施和生产推理。一端是数百万沙盒,另一端是实时服务。全部在同一个平台上运行。”

Ramp(企业财务管理):Ramp的Inspect工具是一个完整上下文的后台编码代理,运行在Modal上。结果是:Ramp的AI代理负责编写70%的已合并PR(拉取请求)。这意味着Ramp工程团队超过一半的代码提交工作,已经由AI代理完成并通过了代码审查。

Decagon(AI客服代理):研究团队报告,使用Modal后,其系统p90延迟达到了342毫秒,远低于自然对话体验所需的亚秒要求。

DoorDash:正在使用Modal Sandboxes为商家构建AI代理,用于管理菜单更新、库存管理等任务。

这些客户案例覆盖了完全不同的场景——从AI编码工具到企业AI代理,从实时推理到批量训练——共同验证了Modal作为”通用AI执行层”的产品定位。


“为AI时代重新构建的云”:Modal的产品定位

Modal CEO Erik Bernhardsson在官方博客里用一句话定义了公司的使命:

“我们创建Modal,是因为为传统Web应用构建的云,永远无法适合AI工作负载。”

这句话值得细嚼。

传统云计算(AWS EC2、Google Cloud VM)的设计哲学,是为”持续运行的服务”服务的:你启动一台服务器,它24小时在线,按小时计费,你来决定什么时候关闭。这对于Web服务、数据库、API服务器都是合理的——这些服务确实需要持续在线。

但AI工作负载的特点是间歇性爆发

  • AI训练可能需要100个GPU连续运行3小时,然后完全停止
  • AI推理可能需要在50毫秒内响应一个请求,如果没有请求,GPU完全空闲
  • AI Agent执行一个任务,需要密集计算10秒,然后等待用户输入可能等5分钟

传统”按小时计费的VM实例”模型,对这类工作负载来说,要么太贵(大量空闲时间浪费),要么太慢(冷启动时间过长)。

Modal的解决方案,是把GPU算力的访问粒度精细化到毫秒级,让开发者以”调用函数”的方式使用GPU,而不是”管理服务器”的方式。代码执行了多少毫秒,就付多少毫秒的算力费用。


AWS崛起的历史,正在GPU基础设施层被重演

理解Modal的价值,需要先理解一段历史。

2006年,亚马逊推出了AWS EC2(弹性计算云)。在此之前,一个互联网创业公司要上线服务,必须自己购买服务器、安装操作系统、配置网络,或者租用机架托管——这些都需要专业的IT运维团队。

AWS EC2改变了这一切。开发者用几行命令就能启动一台虚拟服务器,几分钟后服务就在线了。不再需要IT运维,不再需要提前采购硬件,不再需要为峰值容量提前规划。这个”按需使用”的模型,彻底改变了软件行业的成本结构,并催生了整整一代互联网创业公司。

2026年,同样的事情正在GPU基础设施层发生——但速度更快,幅度更大。

Modal的无服务器模型,把GPU算力的访问门槛从”你需要知道怎么配置GPU集群”降低到了”你需要知道怎么写Python函数”。这个抽象层次的提升,在计算机科学史上有一个清晰的类比:从汇编语言到高级语言,从手动内存管理到垃圾回收,从SSH连接服务器到调用云函数。

每一次类似的抽象,都解锁了一批原本受制于复杂度的应用创新。问题不在于大云厂商能不能做同样的事情——他们技术上完全可以,也在做——而在于Modal已经用3年时间和10亿沙盒的实战数据,建立了一个大云厂商短期内无法靠资金堆砌追上的工程积累和开发者社区。就像Stripe在API支付设计上的领先优势不是传统银行技术部门能简单复制的一样,工程积累需要时间,而时间已经让Modal跑在了前面。


估值逻辑:为什么46.5亿美元不算高估

Modal的估值,在AI基础设施赛道中属于中等偏上。

不同于同赛道中许多聚焦于”AI模型推理部署”的平台,Modal的核心定位更宽:它不是”把AI模型暴露为API的托管服务”,而是”任意Python计算的无服务器执行环境”。

Modal填补的是一个独特的市场空白:有算力(GPU支持),有软件抽象(Serverless函数模型),对Python原生友好——三者同时满足,目前没有其他玩家达到Modal的完成度和客户验证规模(10亿沙盒+年化3亿美元营收)。

Modal的46.5亿美元,是对这个”创造新赛道”判断的资本背书。当General Catalyst(Airbnb、HubSpot、Stripe等的早期投资方)和Redpoint(Netflix、Stripe、Snowflake等的早期投资方)同时领投,他们赌的不是Modal在现有市场里能拿到多少份额,而是Modal正在定义的这个新赛道,最终会有多大。


“AI native”公司的基础设施选择题

这里面有一个更深层的市场逻辑值得展开。

在2026年,越来越多的公司开始被描述为”AI native”——他们不是把AI功能加到现有系统上,而是从零开始把AI作为核心基础设施来构建的公司。这类公司的技术栈选择,和传统企业IT选择截然不同。

传统企业IT选择AI基础设施时,优先考虑AWS/Azure/Google Cloud的原生AI服务,因为与已有IT系统的集成最容易,采购流程最简单,合规认证最成熟。但AI native公司选择AI基础设施时,优先考虑开发者体验、启动速度和成本灵活性,传统大云厂商的”企业级”设计往往被视为过度工程化。

Modal的目标用户,恰好是后者——而这批用户正在以极快的速度成长为行业里最重要的创新者。Cognition(估值20亿美元的AI编码代理公司)、Ramp(企业财务AI)、DoorDash(全美最大外卖平台之一)——这些已经验证的Modal用户,跨越了从纯AI公司到传统科技公司的不同维度。

如果Modal能在”AI native公司”这个用户群中建立起足够深的根基,当这批公司成长为大型企业后,迁移成本会让它们很难切换到传统云厂商。这是一个经典的”抢占增量市场,等待增量变存量”的战略逻辑。


Modal的护城河在哪里

任何优秀的商业分析,都需要直面一个最根本的问题:如果这个市场真的那么好,大公司为什么不进来把它抢走?

对于Modal来说,这个问题的答案需要分开看:

短期护城河(1-3年):技术实现的复杂性。”无服务器GPU”听起来简单,但工程实现极其复杂——需要极快的容器冷启动时间(Modal的目标是亚秒级)、高效的GPU调度算法、跨用户的资源隔离、对数百种Python依赖库的预构建缓存支持……每一个环节都是工程挑战,需要大量经验积累。Modal在这些技术细节上已经迭代了3年,这个积累不是大公司能用资金快速复制的。

中期护城河(3-7年):开发者生态和社区黏性。当大量知名项目、教程、开源库都以Modal为例说明”如何部署AI工作负载”时,切换成本就不只是技术成本,还包括学习成本和心理惯性。10亿沙盒的数据积累,让Modal能够不断优化调度算法,这些优化形成了基于数据的护城河,用户越多、数据越多、产品越好、用户更多——形成正向飞轮。


对立视角:这个模式的挑战

任何优秀的分析,都需要直面真实的挑战:

成本可控性:Serverless计算对于间歇性工作负载极为经济,但对于需要连续运行数天的大规模训练任务,按毫秒计费的成本可能远高于预留实例。Bernhardsson在博客中也坦承,Modal目前专注于”低延迟弹性推理、动态Agent运行时、RL(强化学习)和大规模批量任务”,对超大规模持续训练,他们建议考虑专门的GPU云服务。这种诚实的市场定位,反而是一个好的信号。

竞争压力:AWS、Google Cloud、Azure都在加速推出自己的Serverless GPU服务(AWS Lambda已开始支持GPU工作负载,Google Cloud Run已正式支持NVIDIA GPU)。大云厂商的成本优势和生态整合能力,是所有AI基础设施创业公司长期面临的系统性风险。Modal的回答是:我们在Developer Experience(开发者体验)上的领先优势,以及10亿沙盒积累的调度优化经验,不是大云厂商能快速用资金复制的。而且,越来越多的AI工具和开源项目默认以Modal作为运行环境来写教程,这种”心智占有”的切换成本,比任何技术护城河都更难被取代。

客户粘性:Modal的核心护城河,是10亿沙盒积累的调度优化经验、Python生态集成深度,以及Cognition/Ramp/DoorDash等头部用户形成的示范效应。当越来越多的AI工程师在学习资料、开源教程中看到Modal的用法,切换成本会逐渐从纯技术成本扩展到生态习惯成本。


Modal的市场地图:它在填补哪个空白

从AI基础设施生态的角度看,Modal填补的是一个被大云厂商长期忽视的层次。

大云厂商(AWS/Google/Azure)的设计逻辑是为”企业IT团队”服务的——有DevOps工程师、有基础设施团队、能够管理复杂配置。这套逻辑对于一个20人的AI创业公司、一个独立研究者、或者一个想快速验证原型的工程师,并不友好。

这是一个对Cognition、Ramp这样的AI native公司来说,显而易见的选择——他们不需要再从零开始解决”怎么跑GPU代码”的问题,可以直接把精力放在应用层的差异化上。从这个角度来看,Modal不仅仅是一个基础设施供应商,更像是让AI应用创新的”准入门槛”下降了一个数量级的赋能平台。

Modal的目标用户,恰好是这些”不想、也没有能力自己管理基础设施”的人——而他们正是目前AI创新最活跃的群体。从Cognition这样的AI代理公司,到DoorDash这样的传统科技公司内部的AI团队,都在用Modal绕开基础设施复杂度,专注在应用层的创新。


行业背景:AI基础设施赛道的格局重组

Modal的融资,发生在一个AI基础设施赛道正在快速分层的背景下。

2024-2026年间,这个赛道出现了明显的分化趋势:

第一层:通用云(AWS/Google/Azure)——提供最底层的GPU算力,核心竞争力是规模、稳定性和与其他云服务的集成。他们的目标客户是大型企业和高度定制化需求的专业机构。

第二层:AI专用云(CoreWeave、Lambda Labs等)——聚焦于提供比大云厂商更便宜、更灵活的GPU算力,通常以月为单位租赁整机或集群,不做太多软件层面的抽象。目标客户是中型AI公司和研究机构,需要大规模稳定的训练算力。

第三层:开发者平台(Modal等)——做高层次的软件抽象,把GPU访问封装成API或函数调用,目标客户是开发者和AI native公司,强调”不需要管理基础设施”的体验。

第四层:模型即服务(Anthropic API、OpenAI API等)——完全隐藏底层算力,只提供模型的HTTP接口,按Token计费。

Modal处于第三层,而且它的定位比大多数第三层选手更宽:它不只是”AI模型的推理平台”,而是”任意Python计算的无服务器平台”——这让它有机会从AI工作负载出发,延伸到更广泛的科学计算、数据工程、媒体处理等场景。

这种跨场景的可扩展性,是Modal估值溢价的核心支撑之一。年化3亿美元的营收,来自覆盖从AI推理到强化学习、从批量数据处理到实时代理执行的多样化工作负载——不是单一垂直场景的专一成功,而是一个通用层次的验证。


写在最后

Modal Labs的3.55亿美元,是AI基础设施赛道在2026年的一个重要数据点。

年化3亿美元营收、5倍增长、10亿沙盒——这些不是PPT里的预测,而是真实验证的市场。General Catalyst和Redpoint不是在赌一个概念,而是在赌一个已经开始跑起来的飞轮:AI编程工具产生工作负载,Modal执行工作负载,执行数据改善调度算法,调度越好开发者体验越好,更多AI工具开发者选择Modal。

这里有一个不那么明显、但非常重要的洞察:10亿沙盒,是Modal最难被复制的资产。 它意味着Modal的调度系统见过了10亿种不同的任务——什么时间段资源最紧张、哪些依赖库最常被组合使用(预构建缓存让冷启动从秒级降到毫秒级)、强化学习并行环境的最优分配策略……这种工作负载模式数据,需要真实的大规模使用才能积累,不是竞争对手能靠资金快速复制的。这比任何技术专利都更难被绕开。

从历史的视角来看,这并不是一个新故事。它是AWS EC2对服务器的抽象、是Stripe对支付的抽象、是Twilio对通信的抽象,在GPU算力这个垂直领域的2026年版本。每一次这样的抽象完成,都会解锁一批原本受阻于复杂度的应用和创新。

水电不需要用户知道它来自哪里。算力也不应该。

如果Modal成功,我们将在几年后把”Modal”说出口,就像今天说”AWS”一样理所当然。那个时候,回看2026年5月21日这笔3.55亿美元的融资,大概会成为一个教科书级别的案例:当AI工作负载的规模超越了传统云计算的设计假设,第一批解决”运行层”问题的公司,往往能建立起比任何人预期都更持久的竞争优势。

当然,这一切还需要时间验证。但10亿个沙盒、年化3亿美元营收、5倍的增长速度,已经让这个故事从”概念验证”阶段,进入了”规模验证”阶段。下一个问题,是它能否进入”市场主导”阶段——那才是真正的终局。对于试图理解AI基础设施演化方向的人来说,Modal的这次融资,是值得深度观察的一个行业信号。


参考资料

  1. Modal Labs官方博客: “Modal’s Series C: Raising $355M at a $4.65B valuation” (2026-05-21) https://modal.com/blog/modal-series-c

  2. Reuters: “Modal Labs valued at $4.65 billion as AI coding takes off” (2026-05-21) https://www.reuters.com/business/modal-labs-valued-465-billion-ai-coding-takes-off-2026-05-21/

  3. Modal Labs官网: https://modal.com

  4. AWS Lambda GPU: “AWS Lambda adds Amazon Elastic GPU support”(来自AWS新闻稿,后台技术参考) https://aws.amazon.com/about-aws/whats-new/

  5. Google Cloud Run GPU: https://cloud.google.com/run/docs/configuring/services/gpu