Uber的AI账单爆了，但CTO说值——Gartner告诉你，那80%为什么做错了

同一周发生的两件事

2026年5月第一周，两件事同时发生，没有人把它们放在一起看，但它们其实是同一个故事的两面。

第一件：Uber CTO Praveen Neppalli Naga在TechCrunch StrictlyVC活动上公开坦白，Uber”blew through our AI budget”——AI预算烧完了。与此同时，他说公司的8000名工程师中，现在约有10%的代码由AI自主生成，并且一个用纯Agentic工作流构建的酒店预订系统，把一年的项目周期压缩到了六个月。

第二件：Gartner发布了一项调查结果，样本是350家年收入超过10亿美元、正在真实部署AI自动化的全球企业。调查发现：其中约80%因AI自动化进行了裁员。但那些裁员的公司，看到负面结果或边际收益的概率，与没有裁员的公司没有显著差别。换句话说，裁员本身，不创造ROI。

把这两件事放在一起，就得到了2026年企业Agentic AI的核心悖论：一边是Uber的CTO愿意烧预算、放大工程师的产出，另一边是350家企业中的80%在用裁员试图把AI转化成账面利润——然后发现这条路走不通。

谁在做对的事？谁在为三年后的竞争力埋地雷？这篇文章试图回答这两个问题。

Uber的具体数字：10%、六个月、8000人

先把事实摆清楚，因为这些数字的含义需要被认真理解。

Uber有约8000名工程师和技术工作者。这是一个足够大的样本——相当于一个中型科技公司的全部技术团队。2025年底，Uber向这8000人全面开放了Agentic AI工具。结果是什么？

Neppalli Naga的回答是：目前所有代码产出中，约10%是由AI自主生成的。

他的下一句评价是：在Uber这个规模，10%是个巨大的数字。

这话值得被展开理解。8000名工程师，假设每人每天产出一定量的代码，如果10%是AI自主生成，这意味着：

编码阶段节省了10%的人力时间
相关的代码审查工作量减少了对应比例
测试、文档等后续工作的AI辅助比例同步提高
更重要的是，这些工程师的时间被部分释放到了更高层次的工作上

一个更具体的案例说明了”更高层次”意味着什么：Uber让一个团队，完全使用Agentic工作流，从头构建一套酒店预订集成系统。这是一个涉及多个API对接、支付流程整合、实时库存同步的复杂业务系统。通常情况下，这样的项目需要整整一年才能完成。结果是：六个月交付。

项目周期压缩了整整50%。

但同时，AI预算”爆表”。

理解为什么这两件事可以同时为真，需要先理解Agentic AI的成本结构，以及它与传统企业软件的本质区别。

传统SaaS工具的成本是相对固定的：你买一个授权，一个月固定费用，使用多少功能都一样。Agentic AI工具的成本是使用量驱动的：每次AI代理处理一个任务、每次LLM接受一个提示、每次生成一段代码，都会产生实际的API调用费用。当一家公司对8000名工程师全面开放这些工具，并且工程师们真的开始大量使用时，API成本的增长速度是非线性的——它会随着使用习惯的建立而加速，而不是线性增长。

Uber的”预算爆了”，不是因为AI没用，而恰恰是因为AI太有用、被用得太多、太快、超出了任何保守的预算预测范围。

这是一个企业CFO们需要认真理解的现实：在看到量化ROI之前，你会先看到量化的账单。

Gartner的调查：80%走了一条错误的路

现在来看Gartner那份报告，理解它为什么重要，以及它和Uber案例之间的深层联系。

Gartner调查了350家全球企业——全部年收入超过10亿美元，全部正在试点或部署自主业务能力（intelligent automation），包括Agentic AI、机器人技术、先进自动化等。这是一个不小的样本，而且都是真正在做的企业，不是观望者。

调查的核心发现：其中约80%，因为AI自动化进行了裁员。

但同一份调查同时发现：那些裁员的公司，看到负面结果或边际收益的概率，与没有裁员的公司没有显著差别。裁员本身，不创造ROI。

“很多CEO用裁员来展示快速的AI回报，但这个判断是根本性错误的，”Gartner杰出副总裁分析师Helen Poitevin在2026年5月5日发布的官方研究报告中说。”裁员可能释放了预算空间，但不创造回报。真正提升ROI的企业，不是那些消除了对人的需求的企业，而是那些放大了人的能力的企业。”

这个结论以数据的方式否定了过去两年里无数企业CEO在董事会里讲述的逻辑链：

AI可以做人做的事 → 所以减少人力需求 → 所以降低成本 → 所以ROI提升

Gartner说：逻辑链的最后一步不成立。不是因为AI做不到人做的事，而是因为ROI的来源被系统性误判了。

值得注意的是，这个结论不来自学术研究，而来自真实部署中的企业数据。350家都是亲历者，不是旁观者。他们失败的教训，是最有价值的信号。

为什么裁员不创造ROI：三个层面的深层原因

理解Gartner的结论需要穿透表面，看清楚底层机制。

第一层：AI代理的真实错误率，远超CEO们在PowerPoint里看到的演示。

这不是一个新发现，但它在实际部署中被持续低估。Gartner早前引用的研究（部分来自卡内基梅隆大学）指出，AI代理在处理真实办公室任务时，大约有70%的时间会出错。注意这里的”真实办公室任务”——不是经过精心设计的演示场景，不是有明确边界的单一任务，而是那些带有模糊上下文、多个依赖项、需要判断力的实际工作任务。

70%的错误率意味着什么？用数学来说：你需要一个人类专门去纠正这些错误。伦敦帝国理工学院和微软的研究人员联合发现，AI工具的采用可能反而增加工作负担，因为员工需要同时”看护”多个AI代理、验证它们的输出、纠正它们的错误，并在它们失控时介入。这种”AI监管工作”是全新的工作类型，它不在原来的人力预算里，也没有被裁员所节省的成本所覆盖。

简单说：裁了人，但新增了一种工作，只是这种工作叫”管AI”而不是”做业务”。

第二层：成本结构发生了转移，而不是消失。

Uber的案例精确展示了这一点。人力成本降低了，但API调用成本随着使用量的增加而急剧上升。对于一家拥有8000名工程师的公司，当他们每天、每人都在高频使用Agentic AI工具时，API费用不是线性增长，而是随着使用习惯的建立呈指数增长。

更深层的问题是：企业裁员之后，原本需要那些人去完成的业务需求并没有消失。这些需求只有三种去向——要么转嫁给AI（带来API成本），要么转嫁给剩余员工（带来过载和质量下降风险），要么被放弃（带来直接的业务损失）。三种结果都有代价，而这些代价在裁员决策时往往没有被系统性计算进去。

第三层：被”替换”的工作，从来都不是可以被简单替换的工作。

The Register援引的另一份报告提供了一个令人不安的描述：AI正在做的不是”杀死”工作，而是”拆解”工作——把一份工作的某些子任务抽走、交给AI处理，工作本身变窄了，薪资被压缩了，但没有完全消失。

这个”拆解”效应揭示了一个关键事实：真正可以被AI完全替代的工作，往往是重复性最高、判断性最低的那部分。而这部分，通常不是企业最大的成本项，也不是企业最核心的价值创造点。企业最大的成本项往往是那些需要上下文理解、多方协调、创造性判断的角色——而这恰恰是2026年的AI依然力不从心的地方。

于是出现了一个矛盾：最容易被AI替代的工作，成本贡献最小；成本贡献最大的工作，最难被AI替代。企业如果按照”AI能做就裁人”的逻辑行事，裁掉的往往是一些边缘贡献者，而核心价值创造者并没有被减少，真正的成本节省远小于预期。

那些”做对了”的企业在做什么

Gartner的调研不只是揭示失败，它同时描绘了成功者的画像，而这个画像与失败者有着根本性的区别。

那些真正看到ROI提升的企业，做的是这件事：大力投资新技能、新角色，以及围绕”人指导并扩展自主系统”而构建的操作模型。

翻译成更具体的语言就是：他们没有把AI当成”替换人”的工具，而是当成”扩展人的能力”的工具。不是减少投入，而是升级投入的形式。不是裁员，而是转岗和培训。

从2026年的行业案例里，可以找到这种成功模式的多个具体实例。

Netflix的案例是目前最系统化的。Netflix已经有超过3000名工程师在日常工作中使用Claude Code，但他们的策略从来不是”用了AI就可以少雇工程师”。Netflix的内部建立了一套完整的成熟度模型（Maturity Model），这个模型明确地区分了两件事：第一件，”会使用AI工具”——这是入门级；第二件，”真正改变了软件交付方式”——这才是目标。Netflix的高管在Code with Claude 2026大会上分享了这个模型，强调了一个关键洞察：AI工具的采用和AI效能的实现，中间有一段相当长的路，而那段路需要组织性的投入来走完，不是靠买订阅就能跨越的。

Netflix度量的不是”省了多少人力成本”，而是”有多少工程师真正改变了他们的工作方式、提升了交付速度”。这种度量视角的差异，决定了组织行为的差异，也决定了最终结果的差异。

ServiceNow的案例提供了另一个维度。ServiceNow在Knowledge 2026大会上宣布，他们内部用AI处理IT工单的速度提升了99%。这是一个令人眩晕的数字。但与此同时，ServiceNow没有裁减他们的IT支持团队，而是：一，把这些人从处理重复性工单中解放出来，重新部署到更复杂的问题上；二，推出了AI Control Tower作为企业AI治理工具，专门解决”AI代理失控”的风险——而这个产品的存在本身，就说明了自主AI系统依然需要大量的人类监督和治理工作。

ServiceNow CEO Bill McDermott用了一个高度凝练的说法：”AI作为助手的时代结束了。AI作为工作者的时代开始了。”

这句话的含义不是”AI取代了人类工作者”，而是”如果AI开始像工作者一样运作，你就需要一套管理AI工作者的体系”。管理体系需要人来建立，需要人来维护，需要人来在AI出错时介入纠正。ServiceNow的9秒删库案例（一个真实企业的AI代理在9秒内获得提权并删除了整个生产数据库）证明了这种监管的必要性不是理论上的，而是已经被现实验证过的。

Uber的案例则提供了一个最真实的”过渡期”图景。Uber既不像Netflix那样已经有了系统化的成熟度模型，也不像ServiceNow那样把AI治理产品化，而是处于”全量开放、拥抱混乱、边投入边学习”的阶段。预算爆了，但10%的代码自主生成和50%的项目周期压缩，是两个具体的、可量化的收益数据点。

这三个案例有一个共同点：没有企业说”我们用AI省了多少人力成本”，每一个企业说的都是”我们的工程师/员工/系统现在能做到什么原本做不到的事”。

一个关于规模和未来的深层判断

在分析所有这些之前，需要先建立规模感。

Gartner预测，Agentic AI软件支出将从2025年的864亿美元，增长到2026年的2065亿美元，并在2027年进一步达到3763亿美元。两年内，全球在这个领域的投入从864亿增长到3763亿——增幅接近5倍。

这是一场规模空前的企业变革实验，350家企业只是冰山一角。数以千计的企业正在同时押注，有些做对了，大多数还在犯Gartner说的那个错误。

Gartner同时给出了一个令人意外的长期预测：到2028年或2029年，随着自主业务模型的成熟，这些企业将开始净创造就业岗位——因为新的工作类别将大量涌现，而这些工作是AI无法完成的。

这个预测在表面上看起来像是一种安慰剂式的乐观，但它实际上有着技术演进史上的历史依据。从工业化到互联网，每一次大规模自动化浪潮，最终的结果都是扩大了总就业规模，改变的只是工作的类型而不是工作的总量。工厂流水线的自动化，没有消灭就业；互联网的到来，没有消灭商业；电商的崛起，没有消灭零售，而是创造了快递、仓储、数字营销等全新的就业类别。

Agentic AI有理由遵循同样的规律，但有一个前提条件：在过渡期里，不能把将要承担新工作的人裁掉。

重新理解”预算爆了”的价值

Uber CTO那句”预算爆了”，除了它字面上的含义，还提供了一个更重要的信息：当Agentic AI工具被真正大规模使用时，成本增长的速度超过了几乎所有企业预算规划的预期上限。

这不是Uber独有的经验，而是所有正在或即将大规模部署Agentic AI的企业将会面对的规律。任何使用量驱动的定价模型，在工具被真正好用、被真正大量使用的时候，成本都会超预期。这是工具成功的标志，不是预算管理失败的标志。

理解这一点，对于企业CFO和CTO之间的对话至关重要。CFO看到的是”AI预算超支了30%”，如果没有配套的产出度量，这会被判断为失败；但如果能同时出示”代码自主生成比例达到10%、某项目周期压缩50%”，超支的预算就有了对应的价值锚点，这是成本超支而非浪费。

这里隐藏着一个关键能力的建立要求：在花钱之前，先建立衡量产出的度量框架。

没有度量，”预算爆了”就只是”预算爆了”。有了度量，”预算爆了”可以是”投资产生了回报，但回报的量化需要时间”。Uber能说出那两个具体数字，说明他们在某种程度上已经建立了这种度量能力。很多预算同样超支的企业，没有这种能力——钱花了，不知道换来了什么。

2026年的Agentic AI：五个行业正在发生的并行实验

在深入分析Uber和Gartner之前，有必要把视野放宽，看看同一时期其他行业的并行实验。这些案例共同验证了一个规律：凡是看到真实ROI的企业，都选择了”放大人”而非”替换人”的策略。

金融服务业的案例最能说明问题。Anthropic刚刚在纽约举办了针对银行和保险公司的专属发布会，推出了10套专为金融机构设计的AI代理——分为”研究与客户覆盖”和”财务与运营”两类。但Anthropic的战略负责人说得很清楚：这些代理是给银行分析师用的工具，不是取代银行分析师的机器。JPMorgan Chase的CEO Jamie Dimon亲自在台上演示了如何用Claude Code在20分钟内创建一套资产互换分析仪表盘，他的结论是”很准确”——但他没有说”我要因此裁减我的量化团队”。与此同时，FIS和Anthropic合作推出的Financial Crimes AI Agent把反洗钱调查从”数小时”压缩到”数分钟”，而FIS的表述同样是”让合规团队能够处理更多案例”，而不是”减少合规团队人数”。

企业IT与工单处理领域，ServiceNow的内部AI系统处理IT工单速度提升了99%。但ServiceNow同时推出了AI Control Tower，CEO Bill McDermott的解释意味深长：”AI作为工作者的时代开始了——而工作者需要被管理。”这个管理工具的存在，明确说明了人类角色的转变方向：不是退出，而是从执行者转变为监督者。ServiceNow分享的那个9秒删库案例，更是直接证明了监督的不可替代性。

软件开发行业，Netflix对3000多名工程师建立了成熟度模型，把”会使用AI工具”和”真正改变了软件交付方式”系统性地区分开来。Netflix的度量的不是”省了多少人力成本”，而是”有多少工程师真正通过AI改变了他们的工作效率”。从结果来看，Netflix的工程规模没有缩减，而是在同样的团队规模下实现了更高的交付速度。

这三个行业的共同逻辑，与Uber的案例高度一致，也与Gartner报告描述的成功企业画像高度吻合：增强人的能力，而不是替换人的位置。这不是巧合，而是Agentic AI在真实部署中反复验证的规律。

五种错误，五种代价：那80%企业的决策解剖

在理解”为什么大多数企业做错了”之前，需要先理解他们是怎么做出那个决定的。这不是愚蠢，而是一种系统性的认知偏差，在巨大的外部压力下被放大。

错误一：把AI演示当成AI现实。 每一个AI销售演示都经过精心设计：环境干净、任务边界清晰、输出令人印象深刻。但真实的企业环境是混乱的——数据质量参差不齐，系统间依赖关系复杂，用户的请求往往模糊而带有隐含上下文。从演示到生产部署，中间有一个巨大的鸿沟，而这个鸿沟的成本往往没有被计入ROI预测。

错误二：把裁员混淆成效率提升。 裁员降低了人力成本，这在财务报表上是立即可见的。但效率提升是另一件事，它需要时间来建立。当企业在效率真正提升之前就裁员，等于在收割还没成熟的庄稼——你减少了投入，但收益还没出现。

错误三：低估了新技能的需要。 Agentic AI的部署需要全新类型的技能：如何构建好的提示词工程，如何设计Human-in-the-loop的工作流，如何评估AI输出的质量，如何处理AI的边缘案例。这些技能不是天生的，需要培训，需要实践，需要时间。裁员缩减了可以学习这些技能的人，也缩减了未来人机协作的深度。

错误四：忽视了组织变革的摩擦成本。 用AI替换部分人力工作，不只是技术问题，也是组织变革问题。剩余员工的适应成本、工作流程的重新设计成本、管理模式的调整成本——这些都是真实的，都需要时间和资源。而这些成本在裁员决策时很少被纳入计算。

错误五：用短期财务逻辑解答长期竞争问题。 AI带来的竞争优势是长期的，它体现在几年后的市场份额、产品质量、客户满意度对比里，而不是当季的成本报表。如果用季报的时间框架来评估一个三年期的战略投资，答案永远是”成本太高、回报不明确”。

这五种错误不是孤立的，它们相互强化：压力之下的CEO需要快速显示成果，于是采用了最直接的手段（裁员），而这个手段的短期收益会在数月后衰减，长期竞争力却已经被削弱。

结语：代价和收益活在不同的时钟里

最后，回到那两句话放在一起时的真正含义。

“预算爆了”——这是一个事实，发生在2025年底到2026年春的某个时间点，出现在财务系统里，是可量化的、即时可见的。

“开始看到真实的结果了”——这个”开始”字很重要。不是”已经看到了全部结果”，是”开始”。这意味着收益的兑现是一个持续的过程，在代价已经发生之后，它还在继续实现中。

这两件事活在不同的时钟里。代价的时钟走得很快；收益的时钟走得比较慢。大多数企业、大多数CEO、大多数董事会，习惯了按季报的节奏思考问题。他们等不及收益的时钟走完，于是选择了一条看起来能在财务报表上立即呈现改善的路——裁员降本。

Gartner的数据告诉我们，这条路走不通，因为它把两个时区里的事情搞混了。裁员作用于”现在”，而AI真正的价值需要时间来兑现——需要工具成熟、员工适应、工作流程重塑，每一步都需要时间。

这不是说不能做人力调整。随着AI能力的提升，某些类型的工作确实会减少，这是现实。但这种调整应该是市场机制下的自然演进，而不是在AI能力还远未成熟时的激进行动。今天裁掉的那些人，很可能是三年后承担”管理AI系统”新角色的最合适人选——因为他们最了解业务，最了解那些AI仍然容易出错的边缘场景。

Uber的故事告诉我们，另一条路什么样：接受代价是即时的，相信收益会来，建立度量框架，等待两个时钟的钟面最终对齐。

这需要时间，这需要信念，这需要在账单超出预算时还能对CEO说”继续投”的CTO。

Praveen Neppalli Naga站在台上说”我们把预算烧完了，但我们开始看到结果了”——这句话背后是一种选择：宁可在代价的时区里承受压力，也不在收益的时区里剪断那根正在生长的绳子。

那80%做了另一种选择。他们选择了在代价的时区里用裁员来创造一个账面上的”收益”，但这个收益是虚假的——它消耗的是未来竞争力的一部分。

历史会判断哪种选择更值得。而在这个判断到来之前，那些选择了”放大人”而非”替换人”的企业，正在一天一天地积累它们的竞争优势。

这个差距，正在悄悄扩大。

参考资料

Sierra Raises $950M; Uber CTO: 10% of Code Now Autonomously Generated — TechCrunch, Connie Loizos, 2026年5月4日
https://techcrunch.com/2026/05/04/sierra-raises-950m-as-the-race-to-own-enterprise-ai-gets-serious/
Gartner Says Autonomous Business and AI Layoffs May Create Budget Room But Do Not Deliver Returns — Gartner官方新闻稿, 2026年5月5日
https://www.gartner.com/en/newsroom/press-releases/2026-05-05-gartner-says-autonomous-business-and-artificial-intelligence-layoffs-may-create-budget-room-but-do-not-deliver-returns
AI Layoffs Backfire as Cutting Staff Doesn’t Cut It, Firms Warned — The Register, 2026年5月6日
https://www.theregister.com/ai-and-ml/2026/05/06/ai-layoffs-backfire-as-cutting-staff-doesnt-cut-it-firms-warned/5230631
Coinbase to Lay Off 14% of Staff as Part of Broader Restructuring — TechCrunch, 2026年5月5日
https://techcrunch.com/2026/05/05/coinbase-to-lay-off-14-of-staff-as-part-of-broader-restructuring/
ServiceNow Knowledge 2026: Autonomous Workforce, Otto, AI Control Tower — Fortune, 2026年5月5日
https://fortune.com/2026/05/05/servicenow-knowledge-2026-autonomous-workforce-microsoft-nvidia-ai-announcements/
ServiceNow Kill Switch for AI Agents: The 9-Second Database Deletion Warning — Fortune, 2026年5月6日
https://fortune.com/2026/05/06/servicenow-kill-switch-ai-agents-bill-mcdermott/
Code with Claude 2026: Netflix 3000+ Engineers and the Maturity Model — Simon Willison’s Weblog, 2026年5月6日
https://simonwillison.net/2026/May/6/code-w-claude-2026/

Uber的AI账单爆了，但CTO说值——Gartner告诉你，那80%为什么做错了

Uber的AI账单爆了，但CTO说值——Gartner告诉你，那80%为什么做错了

同一周发生的两件事

Uber的具体数字：10%、六个月、8000人

Gartner的调查：80%走了一条错误的路

为什么裁员不创造ROI：三个层面的深层原因

那些”做对了”的企业在做什么

一个关于规模和未来的深层判断

重新理解”预算爆了”的价值

2026年的Agentic AI：五个行业正在发生的并行实验

五种错误，五种代价：那80%企业的决策解剖

结语：代价和收益活在不同的时钟里

参考资料

Tags:

About

Categories

Recent Posts

Resources