2026 年 4 月的第 1 周,OpenAI 悄然关闭了 Sora——这款曾在 2024 年 2 月以惊艳的文生视频 demo 震撼全球的产品。没有盛大的告别仪式,没有 Sam Altman 发长推文感慨万千,只有一条简短的产品更新通知和一份内部 memo。在关闭前的最后 1 个季度,Sora 的日活下载量较峰值暴跌 65%,累计总收入仅 210 万美元,而每天的推理基础设施成本高达 1000-1500 万美元。这意味着 Sora 在其整个商业化生命周期中,大约每赚 1 美元就要烧掉 2000 美元以上。

这不是一个简单的”产品失败”故事。这是 AI 行业进入 IPO 窗口期后,一家估值 8520 亿美元的公司如何在资本市场逻辑与技术理想主义之间做出残酷取舍的案例研究。更重要的是,Sora 团队并没有被解散——他们被整建制转向了”世界模拟”(World Simulation)方向,服务于机器人和具身智能。这个战略转向背后的逻辑,比 Sora 的关闭本身更值得深挖。


1. 数字不会说谎:Sora 的经济学灾难

让我们先把 Sora 的财务状况摊开来看。

Sora 于 2024 年 12 月正式向公众开放,最初作为 ChatGPT Pro(每月 200 美元)和 Plus(每月 20 美元)的附加功能提供。2025 年初,OpenAI 尝试将其作为独立产品推出,定价从免费试用到 Pro 级别不等。但问题很快暴露:视频生成的推理成本与文本生成完全不在一个量级。

成本端的噩梦: 生成 1 段 20 秒、1080p 的 Sora 视频,所需的 GPU 计算量大约是生成 1 次 GPT-4 级别文本回复的 500-1000 倍。OpenAI 使用的是基于 Diffusion Transformer(DiT)架构的模型,每次视频生成需要数百步去噪迭代,每一步都要在高分辨率的时空 latent space 上运行完整的 Transformer 前向传播。按照 H100 GPU 的市场租赁价格(约 2-3 美元/GPU·小时),生成 1 段视频的边际成本在 5-15 美元之间,具体取决于分辨率和时长。

每天 1000-1500 万美元的运营成本意味着什么?按照中间值 1250 万美元/天计算,Sora 在其约 15 个月的运营期内(2024 年 12 月至 2026 年 3 月底)总共烧掉了约 56 亿美元。而 210 万美元的总收入,连零头都算不上。这个数字甚至不够支付 Sora 团队 1 天的云计算账单。

收入端的冷酷现实: 210 万美元的总收入暗示了一个残酷的事实——几乎没有人愿意为 AI 视频生成付费。即使按照最乐观的假设(所有收入来自 200 美元/月的 Pro 用户),这也只意味着累计约 10,500 个付费用户月。对于一款曾经引发全球关注的产品来说,这个转化率低得令人震惊。

为什么会这样?原因是多层面的:

第 1 层——质量问题。 尽管 Sora 的 demo 令人印象深刻,但实际使用中的一致性、可控性和物理真实性远未达到专业创作者的需求。好莱坞视觉特效工作室 Industrial Light & Magic 的技术总监在 2025 年 SIGGRAPH 大会上公开表示,当前的视频生成模型”在创意探索阶段有趣,但距离生产流水线还有 3-5 年”。手指数量错误、物体穿模、运动不连贯——这些问题在 demo 中可以通过精心挑选来规避,但在真实使用场景中无处遁形。

第 2 层——竞争挤压。 2025 年,视频生成赛道迅速拥挤。Google DeepMind 的 Veo 2、Runway 的 Gen-3 Alpha Turbo、Pika 2.0、字节跳动的即梦(Jimeng)、快手的可灵(Kling)——这些竞品在价格上远低于 Sora(部分甚至免费),而在质量上差距正在快速缩小。特别是中国厂商,凭借更低的推理成本和更激进的定价策略,在消费者市场上对 Sora 形成了围剿。

第 3 层——需求错配。 这是最根本的问题。OpenAI 将 Sora 定位为”创作者工具”,但真正的视频创作者需要的是精确控制(镜头运动、角色一致性、场景衔接),而不是”输入一段文字看看 AI 给你什么惊喜”。而普通消费者虽然对 AI 视频感到新奇,但新鲜感消退后缺乏持续使用的动力——生成一段有趣的视频发到社交媒体后,然后呢?这不像 ChatGPT 那样能嵌入日常工作流。


2. IPO 前的手术刀:为什么是现在?

Sora 的问题不是今天才出现的。下载量的 65% 暴跌发生在 2025 年下半年到 2026 年初,但 OpenAI 选择在 2026 年 4 月动手,时间点绝非巧合。

关键背景: OpenAI 刚刚在 2026 年 4 月初完成了 1220 亿美元的融资轮,估值达到 8520 亿美元。投资方阵容堪称豪华——SoftBank(300 亿美元)、Amazon(500 亿美元)、NVIDIA(300 亿美元)、Microsoft(约 120 亿美元)。(来源: 综合报道, 2026-04-02) 这轮融资的完成,标志着 OpenAI 正式进入 IPO 准备期。据多家媒体报道,OpenAI 的 IPO 目标窗口在 2027 年上半年。

在 IPO 叙事中,每一个百分点的毛利率都至关重要。Sora 是一个每天吞噬 1000-1500 万美元、几乎零收入的黑洞。保留它,意味着在 S-1 文件中向公开市场投资者展示一个每年烧掉数十亿美元的亏损产品线。砍掉它,则可以立即改善运营亏损数字,同时将叙事从”我们有一个赔钱的视频产品”转变为”我们正在战略投资世界模拟和机器人——下一个万亿美元市场”。

这正是 IPO 前典型的”组合优化”操作。参考 Uber 在 2019 年 IPO 前剥离自动驾驶部门 ATG(后以 40 亿美元卖给 Aurora),以及 WeWork 在 IPO 尝试前砍掉 WeLive 和 WeGrow 等亏损业务线。逻辑完全一致:在公开市场投资者审视你的财务报表之前,把最难看的数字清理掉。

但这里有一个更深层的计算。 OpenAI 目前的月收入约 20 亿美元(来源: 综合报道, 2026-04-02),年化约 240 亿美元。但其年度运营支出(包括推理计算、训练计算、人员、数据中心租赁等)估计在 90 亿美元以上——OpenAI 自己也在 ChatGPT 中测试广告模式以应对这一烧钱速度(来源: 综合报道, 2026 年初)。砍掉 Sora 每天 1000-1500 万美元的支出,意味着每年节省 36-55 亿美元。这不是小数目——这可能是 OpenAI 从”巨额亏损”转向”接近盈亏平衡”的关键一步。

OpenAI 预计 2030 年才能实现盈利(来源: 综合报道, 2026-04-02),但 IPO 不需要你盈利——它需要你展示一条清晰的盈利路径。砍掉 Sora,就是在这条路径上移除了最大的一块绊脚石。


3. “世界模拟”转向:战略天才还是体面撤退?

Sora 团队没有被裁员。他们被转向了一个新方向:面向机器人和具身智能的”世界模拟”(World Simulation)。这个决策值得仔细拆解。

技术逻辑

Sora 的底层技术——Diffusion Transformer 在时空 latent space 上的建模能力——本质上就是在学习物理世界的运动规律。当你训练一个模型生成”一只猫跳上桌子”的视频时,模型必须隐式地学习重力、碰撞、物体形变等物理概念。OpenAI 在 2024 年 2 月发布 Sora 技术报告时就明确提出,视频生成模型是”世界模拟器”(World Simulators)的雏形。

将这种能力从”生成好看的视频给人看”转向”生成物理真实的场景给机器人学习”,在技术上是一个自然的延伸。具体来说,世界模型(World Model)在机器人领域有 3 个核心应用:

  1. 合成训练数据: 机器人需要海量的交互数据来学习操作技能,但在真实世界中收集数据既昂贵又缓慢。一个高质量的世界模型可以生成无限的模拟场景,让机器人在虚拟环境中”练习”。这就是 NVIDIA 的 Isaac Sim 和 Google DeepMind 的 UniSim 正在做的事情。

  2. 模型预测控制(MPC): 机器人可以使用世界模型来”想象”不同动作的后果,然后选择最优策略。这要求世界模型具备物理真实性和因果推理能力——恰好是视频生成模型正在发展的方向。

  3. Sim-to-Real 迁移: 如果世界模型足够精确,在模拟中学到的策略可以直接迁移到真实机器人上。这是当前机器人学习领域最大的瓶颈之一,也是最大的机会。

市场逻辑

机器人和具身智能是 2025-2026 年最热的投资主题之一。Tesla 的 Optimus 人形机器人、Figure AI(估值超过 400 亿美元)、1X Technologies、Agility Robotics——这个赛道的估值泡沫正在快速膨胀。对于一家即将 IPO 的公司来说,”我们正在构建机器人的大脑”比”我们有一个生成短视频的工具”要性感得多。

更重要的是,世界模拟的商业模式与视频生成完全不同。视频生成是 to-C 产品,面临价格敏感的消费者和激烈的竞争。世界模拟是 to-B 甚至 to-B-to-B 的基础设施层,客户是机器人公司、自动驾驶公司、工业自动化企业——这些客户的支付意愿和支付能力远高于普通消费者。

两个对立视角

乐观视角(我部分认同): 这是 OpenAI 在 Sora 的技术积累上进行的一次精明的价值重定向。视频生成模型的训练投入不会浪费——这些模型对物理世界的理解,恰好是世界模拟所需要的核心能力。OpenAI 拥有全球最大规模的视频训练数据和最先进的 DiT 架构,转向世界模拟是”把同一把锤子用在更值钱的钉子上”。

悲观视角(我更倾向于此): “世界模拟”目前更多是一个叙事而非产品。从视频生成到真正可用的机器人世界模型,中间隔着巨大的技术鸿沟。视频生成模型学到的”物理直觉”是统计性的、近似的,而机器人需要的物理模拟是精确的、可靠的。一个视频模型可以生成”看起来像”物体碰撞的画面,但它并不真正理解牛顿第 3 定律。让一个 Diffusion Transformer 输出的模拟结果精确到可以指导真实机器人的操作,这个问题的难度可能不亚于从头构建一个全新的系统。

我的判断: 世界模拟转向在短期内(12-18 个月)更多是 IPO 叙事管理,而非真正的产品落地。但从 3-5 年的时间尺度看,视频生成模型确实是通向世界模型的一条合理路径。OpenAI 的真正挑战在于,能否在 IPO 之后继续对这个方向保持耐心投入,而不是在公开市场的季度业绩压力下再次砍掉它。


4. 被忽视的信号:AI 视频生成的整体困境

Sora 的失败不是个案。它揭示了整个 AI 视频生成赛道的结构性问题。

Runway 的困境: Runway 是视频生成领域最早的玩家之一,估值在 2024 年一度达到 40 亿美元。但到 2025 年底,Runway 的增长明显放缓,被迫从”创作者工具”转向”企业 API”定位。其核心问题与 Sora 如出一辙——推理成本高、用户留存低、商业化困难。

Pika 的转型: Pika 在 2024 年融资 8000 万美元后,也在 2025 年悄然将重心从视频生成转向了”AI 视觉特效”——一个更窄但商业化更清晰的赛道。这本质上是承认了”通用视频生成”作为独立产品的商业模式不成立。

中国玩家的策略差异: 值得注意的是,字节跳动的即梦和快手的可灵采取了完全不同的策略——它们从未试图将视频生成作为独立的付费产品,而是将其作为短视频平台生态的增值功能。这种”嵌入式”策略可能是视频生成唯一可行的商业模式:不是让用户为视频生成本身付费,而是用它来增强一个已有的、高频使用的平台。

这引出了一个更大的问题: 生成式 AI 的哪些模态能够独立商业化?

  • 文本生成(ChatGPT, Claude): 已验证。高频使用、低边际成本、嵌入工作流。ChatGPT 月收入 20 亿美元。
  • 图像生成(Midjourney, DALL-E): 部分验证。Midjourney 在 2024 年实现了约 2 亿美元的年收入,但增长已趋于平缓。
  • 代码生成(GitHub Copilot, Cursor): 已验证。直接提升开发者生产力,支付意愿高。
  • 音频/音乐生成(Suno, Udio): 尚未验证。面临与视频类似的”新鲜感衰退”问题。
  • 视频生成(Sora, Runway): 已证伪(作为独立产品)。成本过高、需求不足、缺乏工作流嵌入点。

这个分析框架揭示了一个关键洞察:生成式 AI 产品的商业化能力,与其输出的”信息密度”和”工作流嵌入深度”正相关。 文本和代码是高信息密度、深度嵌入工作流的模态;视频是低信息密度(相对于其计算成本)、浅层嵌入工作流的模态。这不是技术问题,而是经济学问题。


5. OpenAI 的 IPO 棋局:Sora 只是第 1 步

将 Sora 的关闭放在 OpenAI 更大的战略图景中,你会看到一系列相互关联的棋步。

棋步 1:完成 1220 亿美元融资。 这轮融资不仅提供了资金,更重要的是锁定了战略投资者。Amazon 的 500 亿美元投资意味着 AWS 将成为 OpenAI 的关键基础设施合作伙伴(补充 Microsoft Azure 的角色)。NVIDIA 的 300 亿美元投资确保了 GPU 供应的优先级。SoftBank 的 300 亿美元则与 Stargate 数据中心项目(与 Oracle 合作)直接相关。(来源: 综合报道, 2026-04-02)

棋步 2:砍掉 Sora,优化财务结构。 如前所述,每年节省 36-55 亿美元的运营支出。

棋步 3:在 ChatGPT 中测试广告。 尽管 Sam Altman 此前公开表示对 AI+广告模式持保留态度,但 90 亿美元的年度烧钱速度不允许他继续矜持。(来源: 综合报道, 2026 年初) 广告收入可以显著改善收入结构的多元性——IPO 投资者不喜欢过度依赖单一收入来源(订阅)的公司。

棋步 4:加强政府关系。 OpenAI 任命前美军网络战高级将领和前陆军将领进入董事会。(来源: 综合报道, 2026-04-02) 同时与五角大楼的军事合作也在推进中。(来源: 综合报道, 2026-04-02) 这不仅是为了政府合同收入,更是为了在地缘政治紧张的环境下获得监管层面的保护。一家与美国国防部深度绑定的 AI 公司,在 IPO 审批过程中会遇到更少的政治阻力。

棋步 5:构建”统一 AI 超级应用”叙事。 OpenAI 的 IPO 故事不会是”我们是一家聊天机器人公司”,而是”我们是 AI 时代的操作系统”。ChatGPT 是入口,API 是基础设施,世界模拟是未来。Sora 的关闭恰好服务于这个叙事——它不是失败,而是”战略聚焦”。

这里有一个大多数人没看到的风险: OpenAI 的 8520 亿美元估值,基于的是”AI 将吞噬一切”的最大化假设。但 Sora 的失败恰恰证明了,AI 并不能在所有模态和所有场景中都创造商业价值。如果 IPO 后市场开始用更严格的标准审视 OpenAI 的各条业务线,类似 Sora 的”烧钱无回报”问题可能会在其他产品上重演。OpenAI 的 Voice 功能、图像生成功能、以及正在开发的 Agent 功能——这些产品线的单位经济模型是否健康?目前没有人知道,因为 OpenAI 作为私有公司不需要披露这些数据。但 IPO 后,这些数字将无处遁形。


6. 更广阔的图景:AI 行业的”Sora 时刻”

Sora 的关闭,与同期发生的另一起事件形成了有趣的对照:Yupp.ai 的关闭。

Yupp.ai 获得了 a16z 的 Chris Dixon 领投的 3300 万美元种子轮,拥有 130 万用户,但最终因无法找到产品市场契合点而关闭。(来源: cryptorank.io, 2026-04-01) 其众包 AI 模型评测平台的模式,被快速迭代的模型本身所颠覆——当模型每隔几周就更新一次时,基于人工反馈的评测数据还没收集完就已经过时了。

Sora 和 Yupp.ai 的失败,指向了 AI 创业领域的一个共同教训:技术能力 ≠ 产品市场契合。 Sora 在技术上是令人印象深刻的,Yupp.ai 的众包评测概念也是合理的,但两者都没有找到用户愿意持续付费的使用场景。

与此同时,Sycamore 获得了 6500 万美元种子轮来构建企业 AI Agent 编排层。(来源: TechCrunch , 2026 年) 其天使投资人包括 Bob McGrew(前 OpenAI 研究副总裁)、Lip-Bu Tan(Intel CEO)和 Ali Ghodsi(Databricks CEO)。这个投资阵容本身就说明了一个问题:从 OpenAI 出来的高管,把钱投向了企业级 Agent 编排,而不是消费级内容生成。他们用脚投票,表明了对 AI 商业化路径的判断。

Oracle 的大规模裁员(影响数千人,部分报道称最多 30,000 人)也是同一逻辑的体现——Oracle 在砍掉传统业务线的人员,将资源转向 AI 数据中心投资(包括与 OpenAI 的 Stargate 合作)。(来源: 综合报道, 2026 年) 华尔街的反应很直接:裁员消息公布当天,Oracle 股价上涨 4%。市场在奖励”砍掉低效业务、聚焦 AI 基础设施”的决策。

这就是 2026 年 AI 行业的主旋律:从”什么都做”到”只做能赚钱的”。 经历了 2023-2025 年的狂热投入后,行业正在进入一个残酷的筛选期。能够独立商业化的 AI 应用(ChatGPT、Copilot、企业 Agent)将获得更多资源;无法独立商业化的应用(视频生成、音乐生成、通用评测平台)要么被关闭,要么被吸收为更大产品的功能模块。


7. 技术债务与沉没成本:Sora 的训练投入去哪了?

一个经常被忽视的问题是:OpenAI 在 Sora 上的训练投入到底有多大?

根据公开信息推算,Sora 的训练使用了数万张 H100 GPU,训练时间长达数月。按照 H100 的市场价格和电力成本,仅训练阶段的投入就可能在 5-10 亿美元量级。加上数据采集(OpenAI 与 Shutterstock 的合作、以及引发版权诉讼的网络视频爬取)、团队人力成本(Sora 核心团队约 50-80 人,包括从 Google Brain 和 Meta FAIR 挖来的顶级研究员)、以及前述的推理运营成本,Sora 的总投入可能超过 60 亿美元。

这些投入是否全部沉没?不完全是。

可迁移的资产包括:

  • DiT 架构的研发成果和训练 know-how
  • 大规模视频数据的处理和标注流水线
  • 时空建模的核心模型权重(可作为世界模拟的预训练基础)
  • 高效视频推理的工程优化(降低延迟、减少显存占用)

不可迁移的资产包括:

  • 面向消费者的产品设计和用户体验投入
  • 内容审核和安全过滤系统(视频生成的安全需求与世界模拟完全不同)
  • 品牌和市场推广投入
  • 与创作者社区建立的关系网络

我的估算是,Sora 总投入的大约 40-50% 可以迁移到世界模拟方向。这意味着 30-35 亿美元的投入变成了真正的沉没成本。对于一家刚融了 1220 亿美元的公司来说,这个数字可以承受。但它提醒我们:即使是 OpenAI 这样的巨头,也无法承受无限期地为一个没有商业回报的产品烧钱。


8. 版权诉讼的暗影

Sora 的关闭还有一个很少被公开讨论的因素:版权风险。

企鹅兰登书屋(Penguin Random House)已经起诉 OpenAI,称 ChatGPT “记忆”并复制了受版权保护的内容。(来源: 综合报道 / genova14.org, 2026-04-02) 虽然这起诉讼针对的是文本模型,但视频生成模型面临的版权风险更大。Sora 的训练数据中包含大量来自 YouTube、Vimeo 和其他平台的视频内容,其中绝大部分未获得版权授权。

2025 年,多家影视公司和内容创作者已经对 AI 视频生成公司提起了集体诉讼。如果法院最终裁定 AI 视频生成构成版权侵权,OpenAI 可能面临数十亿美元的赔偿。关闭 Sora,在某种程度上也是在降低法律风险敞口——一个已经关闭的产品,在诉讼中的赔偿金额会远低于一个仍在运营并持续产生侵权内容的产品。

相比之下,世界模拟方向的版权风险要小得多。生成物理模拟场景供机器人训练,不涉及对特定创意作品的复制或模仿。这是一个被低估的战略考量。


9. 对行业的启示:So What?

Sora 的关闭对不同的利益相关者意味着不同的事情。

对 AI 创业者: 不要被技术 demo 的惊艳所迷惑。在选择方向时,首先回答 3 个问题:(1) 用户会每天使用这个产品吗?(2) 单次使用的推理成本是否低于用户支付意愿?(3) 这个产品是否能嵌入已有的工作流?如果这 3 个问题中有任何 1 个的答案是”否”,你需要重新思考你的商业模式。Sycamore 获得 6500 万美元种子轮的原因,恰恰是因为企业 AI Agent 编排在这 3 个问题上都给出了”是”的答案。

对投资者: AI 行业正在从”投赛道”转向”投单位经济模型”。2023-2024 年,投资者愿意为”AI + 任何东西”买单。2026 年,他们开始问”你的 LTV/CAC 是多少?”和”你的推理成本曲线是什么样的?”。Yupp.ai 的 3300 万美元打了水漂,Sora 烧掉了数十亿美元——这些教训正在改变投资者的风险偏好。

对大型科技公司: Sora 的失败并不意味着视频生成没有价值,而是意味着它不能作为独立产品存在。Google 将 Veo 嵌入 YouTube 创作工具,字节跳动将即梦嵌入抖音/TikTok——这种”嵌入式”策略可能是唯一可行的路径。OpenAI 的问题在于,它没有一个自有的视频分发平台来嵌入 Sora。这是一个平台劣势,不是技术劣势。

对 OpenAI 的 IPO 前景: 短期来看,砍掉 Sora 是正确的财务决策。但长期来看,它暴露了 OpenAI 商业模式的一个根本性脆弱点:过度依赖 ChatGPT 单一产品。 如果 ChatGPT 的增长放缓(而它终将放缓),OpenAI 需要第 2 条收入曲线。API 收入是一条,但 API 的毛利率远低于消费者订阅。广告是另一条,但 AI 广告的效果和用户接受度尚未验证。世界模拟和机器人是第 3 条,但距离商业化还有数年。

OpenAI 的 8520 亿美元估值,隐含的假设是它将在多个 AI 模态和多个市场中取得主导地位。Sora 的失败是对这个假设的第 1 次重大打击。不会是最后一次。


10. 结语:从 Sora 的废墟中看 AI 的未来

2024 年 2 月,当 Sora 的 demo 视频在社交媒体上疯传时,无数人惊呼”视频创作的民主化时代来了”。2026 年 4 月,当 Sora 悄然关闭时,这个承诺已经碎成了 210 万美元的总收入和数十亿美元的沉没成本。

但 Sora 并非毫无意义。它证明了 Diffusion Transformer 可以在时空维度上进行连贯建模;它推动了整个视频生成领域的技术进步;它为世界模拟方向积累了宝贵的技术资产。Sora 的失败不是技术的失败,而是商业模式的失败——或者更准确地说,是”在错误的时间把正确的技术推向了错误的市场”。

对于关注 AI 行业的人来说,Sora 的故事提供了一个至关重要的分析框架:不要只问”这个技术能做什么”,要问”这个技术的经济学是什么”。 每生成 1 秒视频的成本是多少?用户愿意为这 1 秒视频付多少钱?这两个数字之间的差距,决定了一个 AI 产品的生死。

在 OpenAI 的 IPO 路演中,Sora 将被描述为”一次成功的技术探索,其成果正在被应用于更具战略价值的世界模拟方向”。这是一个精心构建的叙事。但数字不会说谎:每天 1000-1500 万美元的烧钱速度,210 万美元的总收入,65% 的下载量暴跌。这些数字讲述的是一个不同的故事——一个关于 AI 行业从狂热走向理性的故事。

而这个故事,才刚刚开始。


参考资料

  1. OpenAI closes $40B funding round at $300B valuation — OpenAI 官方博客, 2025-04-02
  2. Sora is here — OpenAI 官方博客, 2024-12-09
  3. Video generation models as world simulators — OpenAI 技术报告, 2024-02-15
  4. Sycamore raises $65M seed round for enterprise AI agent orchestration — TechCrunch (), 2026
  5. Yupp AI shuts down after raising $33M from a16z — CryptoRank, 2026-04-01
  6. OpenAI appoints former US military cyber officials to board — WorldNews.bg, 2026-04-02
  7. Oracle layoffs and AI data center investment — 综合报道, 2026