Uber的AI账单爆了,但CTO说值——Gartner告诉你,那80%为什么做错了
Uber的AI账单爆了,但CTO说值——Gartner告诉你,那80%为什么做错了
同一周发生的两件事
2026年5月第一周,两件事同时发生,没有人把它们放在一起看,但它们其实是同一个故事的两面。
第一件:Uber CTO Praveen Neppalli Naga在TechCrunch StrictlyVC活动上公开坦白,Uber”blew through our AI budget”——AI预算烧完了。与此同时,他说公司的8000名工程师中,现在约有10%的代码由AI自主生成,并且一个用纯Agentic工作流构建的酒店预订系统,把一年的项目周期压缩到了六个月。
第二件:Gartner发布了一项调查结果,样本是350家年收入超过10亿美元、正在真实部署AI自动化的全球企业。调查发现:其中约80%因AI自动化进行了裁员。但那些裁员的公司,看到负面结果或边际收益的概率,与没有裁员的公司没有显著差别。换句话说,裁员本身,不创造ROI。
把这两件事放在一起,就得到了2026年企业Agentic AI的核心悖论:一边是Uber的CTO愿意烧预算、放大工程师的产出,另一边是350家企业中的80%在用裁员试图把AI转化成账面利润——然后发现这条路走不通。
谁在做对的事?谁在为三年后的竞争力埋地雷?这篇文章试图回答这两个问题。
Uber的具体数字:10%、六个月、8000人
先把事实摆清楚,因为这些数字的含义需要被认真理解。
Uber有约8000名工程师和技术工作者。这是一个足够大的样本——相当于一个中型科技公司的全部技术团队。2025年底,Uber向这8000人全面开放了Agentic AI工具。结果是什么?
Neppalli Naga的回答是:目前所有代码产出中,约10%是由AI自主生成的。
他的下一句评价是:在Uber这个规模,10%是个巨大的数字。
这话值得被展开理解。8000名工程师,假设每人每天产出一定量的代码,如果10%是AI自主生成,这意味着:
- 编码阶段节省了10%的人力时间
- 相关的代码审查工作量减少了对应比例
- 测试、文档等后续工作的AI辅助比例同步提高
- 更重要的是,这些工程师的时间被部分释放到了更高层次的工作上
一个更具体的案例说明了”更高层次”意味着什么:Uber让一个团队,完全使用Agentic工作流,从头构建一套酒店预订集成系统。这是一个涉及多个API对接、支付流程整合、实时库存同步的复杂业务系统。通常情况下,这样的项目需要整整一年才能完成。结果是:六个月交付。
项目周期压缩了整整50%。
但同时,AI预算”爆表”。
理解为什么这两件事可以同时为真,需要先理解Agentic AI的成本结构,以及它与传统企业软件的本质区别。
传统SaaS工具的成本是相对固定的:你买一个授权,一个月固定费用,使用多少功能都一样。Agentic AI工具的成本是使用量驱动的:每次AI代理处理一个任务、每次LLM接受一个提示、每次生成一段代码,都会产生实际的API调用费用。当一家公司对8000名工程师全面开放这些工具,并且工程师们真的开始大量使用时,API成本的增长速度是非线性的——它会随着使用习惯的建立而加速,而不是线性增长。
Uber的”预算爆了”,不是因为AI没用,而恰恰是因为AI太有用、被用得太多、太快、超出了任何保守的预算预测范围。
这是一个企业CFO们需要认真理解的现实:在看到量化ROI之前,你会先看到量化的账单。
Gartner的调查:80%走了一条错误的路
现在来看Gartner那份报告,理解它为什么重要,以及它和Uber案例之间的深层联系。
Gartner调查了350家全球企业——全部年收入超过10亿美元,全部正在试点或部署自主业务能力(intelligent automation),包括Agentic AI、机器人技术、先进自动化等。这是一个不小的样本,而且都是真正在做的企业,不是观望者。
调查的核心发现:其中约80%,因为AI自动化进行了裁员。
但同一份调查同时发现:那些裁员的公司,看到负面结果或边际收益的概率,与没有裁员的公司没有显著差别。裁员本身,不创造ROI。
“很多CEO用裁员来展示快速的AI回报,但这个判断是根本性错误的,”Gartner杰出副总裁分析师Helen Poitevin在2026年5月5日发布的官方研究报告中说。”裁员可能释放了预算空间,但不创造回报。真正提升ROI的企业,不是那些消除了对人的需求的企业,而是那些放大了人的能力的企业。”
这个结论以数据的方式否定了过去两年里无数企业CEO在董事会里讲述的逻辑链:
AI可以做人做的事 → 所以减少人力需求 → 所以降低成本 → 所以ROI提升
Gartner说:逻辑链的最后一步不成立。不是因为AI做不到人做的事,而是因为ROI的来源被系统性误判了。
值得注意的是,这个结论不来自学术研究,而来自真实部署中的企业数据。350家都是亲历者,不是旁观者。他们失败的教训,是最有价值的信号。
为什么裁员不创造ROI:三个层面的深层原因
理解Gartner的结论需要穿透表面,看清楚底层机制。
第一层:AI代理的真实错误率,远超CEO们在PowerPoint里看到的演示。
这不是一个新发现,但它在实际部署中被持续低估。Gartner早前引用的研究(部分来自卡内基梅隆大学)指出,AI代理在处理真实办公室任务时,大约有70%的时间会出错。注意这里的”真实办公室任务”——不是经过精心设计的演示场景,不是有明确边界的单一任务,而是那些带有模糊上下文、多个依赖项、需要判断力的实际工作任务。
70%的错误率意味着什么?用数学来说:你需要一个人类专门去纠正这些错误。伦敦帝国理工学院和微软的研究人员联合发现,AI工具的采用可能反而增加工作负担,因为员工需要同时”看护”多个AI代理、验证它们的输出、纠正它们的错误,并在它们失控时介入。这种”AI监管工作”是全新的工作类型,它不在原来的人力预算里,也没有被裁员所节省的成本所覆盖。
简单说:裁了人,但新增了一种工作,只是这种工作叫”管AI”而不是”做业务”。
第二层:成本结构发生了转移,而不是消失。
Uber的案例精确展示了这一点。人力成本降低了,但API调用成本随着使用量的增加而急剧上升。对于一家拥有8000名工程师的公司,当他们每天、每人都在高频使用Agentic AI工具时,API费用不是线性增长,而是随着使用习惯的建立呈指数增长。
更深层的问题是:企业裁员之后,原本需要那些人去完成的业务需求并没有消失。这些需求只有三种去向——要么转嫁给AI(带来API成本),要么转嫁给剩余员工(带来过载和质量下降风险),要么被放弃(带来直接的业务损失)。三种结果都有代价,而这些代价在裁员决策时往往没有被系统性计算进去。
第三层:被”替换”的工作,从来都不是可以被简单替换的工作。
The Register援引的另一份报告提供了一个令人不安的描述:AI正在做的不是”杀死”工作,而是”拆解”工作——把一份工作的某些子任务抽走、交给AI处理,工作本身变窄了,薪资被压缩了,但没有完全消失。
这个”拆解”效应揭示了一个关键事实:真正可以被AI完全替代的工作,往往是重复性最高、判断性最低的那部分。而这部分,通常不是企业最大的成本项,也不是企业最核心的价值创造点。企业最大的成本项往往是那些需要上下文理解、多方协调、创造性判断的角色——而这恰恰是2026年的AI依然力不从心的地方。
于是出现了一个矛盾:最容易被AI替代的工作,成本贡献最小;成本贡献最大的工作,最难被AI替代。企业如果按照”AI能做就裁人”的逻辑行事,裁掉的往往是一些边缘贡献者,而核心价值创造者并没有被减少,真正的成本节省远小于预期。
那些”做对了”的企业在做什么
Gartner的调研不只是揭示失败,它同时描绘了成功者的画像,而这个画像与失败者有着根本性的区别。
那些真正看到ROI提升的企业,做的是这件事:大力投资新技能、新角色,以及围绕”人指导并扩展自主系统”而构建的操作模型。
翻译成更具体的语言就是:他们没有把AI当成”替换人”的工具,而是当成”扩展人的能力”的工具。不是减少投入,而是升级投入的形式。不是裁员,而是转岗和培训。
从2026年的行业案例里,可以找到这种成功模式的多个具体实例。
Netflix的案例是目前最系统化的。Netflix已经有超过3000名工程师在日常工作中使用Claude Code,但他们的策略从来不是”用了AI就可以少雇工程师”。Netflix的内部建立了一套完整的成熟度模型(Maturity Model),这个模型明确地区分了两件事:第一件,”会使用AI工具”——这是入门级;第二件,”真正改变了软件交付方式”——这才是目标。Netflix的高管在Code with Claude 2026大会上分享了这个模型,强调了一个关键洞察:AI工具的采用和AI效能的实现,中间有一段相当长的路,而那段路需要组织性的投入来走完,不是靠买订阅就能跨越的。
Netflix度量的不是”省了多少人力成本”,而是”有多少工程师真正改变了他们的工作方式、提升了交付速度”。这种度量视角的差异,决定了组织行为的差异,也决定了最终结果的差异。
ServiceNow的案例提供了另一个维度。ServiceNow在Knowledge 2026大会上宣布,他们内部用AI处理IT工单的速度提升了99%。这是一个令人眩晕的数字。但与此同时,ServiceNow没有裁减他们的IT支持团队,而是:一,把这些人从处理重复性工单中解放出来,重新部署到更复杂的问题上;二,推出了AI Control Tower作为企业AI治理工具,专门解决”AI代理失控”的风险——而这个产品的存在本身,就说明了自主AI系统依然需要大量的人类监督和治理工作。
ServiceNow CEO Bill McDermott用了一个高度凝练的说法:”AI作为助手的时代结束了。AI作为工作者的时代开始了。”
这句话的含义不是”AI取代了人类工作者”,而是”如果AI开始像工作者一样运作,你就需要一套管理AI工作者的体系”。管理体系需要人来建立,需要人来维护,需要人来在AI出错时介入纠正。ServiceNow的9秒删库案例(一个真实企业的AI代理在9秒内获得提权并删除了整个生产数据库)证明了这种监管的必要性不是理论上的,而是已经被现实验证过的。
Uber的案例则提供了一个最真实的”过渡期”图景。Uber既不像Netflix那样已经有了系统化的成熟度模型,也不像ServiceNow那样把AI治理产品化,而是处于”全量开放、拥抱混乱、边投入边学习”的阶段。预算爆了,但10%的代码自主生成和50%的项目周期压缩,是两个具体的、可量化的收益数据点。
这三个案例有一个共同点:没有企业说”我们用AI省了多少人力成本”,每一个企业说的都是”我们的工程师/员工/系统现在能做到什么原本做不到的事”。
一个关于规模和未来的深层判断
在分析所有这些之前,需要先建立规模感。
Gartner预测,Agentic AI软件支出将从2025年的864亿美元,增长到2026年的2065亿美元,并在2027年进一步达到3763亿美元。两年内,全球在这个领域的投入从864亿增长到3763亿——增幅接近5倍。
这是一场规模空前的企业变革实验,350家企业只是冰山一角。数以千计的企业正在同时押注,有些做对了,大多数还在犯Gartner说的那个错误。
Gartner同时给出了一个令人意外的长期预测:到2028年或2029年,随着自主业务模型的成熟,这些企业将开始净创造就业岗位——因为新的工作类别将大量涌现,而这些工作是AI无法完成的。
这个预测在表面上看起来像是一种安慰剂式的乐观,但它实际上有着技术演进史上的历史依据。从工业化到互联网,每一次大规模自动化浪潮,最终的结果都是扩大了总就业规模,改变的只是工作的类型而不是工作的总量。工厂流水线的自动化,没有消灭就业;互联网的到来,没有消灭商业;电商的崛起,没有消灭零售,而是创造了快递、仓储、数字营销等全新的就业类别。
Agentic AI有理由遵循同样的规律,但有一个前提条件:在过渡期里,不能把将要承担新工作的人裁掉。
重新理解”预算爆了”的价值
Uber CTO那句”预算爆了”,除了它字面上的含义,还提供了一个更重要的信息:当Agentic AI工具被真正大规模使用时,成本增长的速度超过了几乎所有企业预算规划的预期上限。
这不是Uber独有的经验,而是所有正在或即将大规模部署Agentic AI的企业将会面对的规律。任何使用量驱动的定价模型,在工具被真正好用、被真正大量使用的时候,成本都会超预期。这是工具成功的标志,不是预算管理失败的标志。
理解这一点,对于企业CFO和CTO之间的对话至关重要。CFO看到的是”AI预算超支了30%”,如果没有配套的产出度量,这会被判断为失败;但如果能同时出示”代码自主生成比例达到10%、某项目周期压缩50%”,超支的预算就有了对应的价值锚点,这是成本超支而非浪费。
这里隐藏着一个关键能力的建立要求:在花钱之前,先建立衡量产出的度量框架。
没有度量,”预算爆了”就只是”预算爆了”。有了度量,”预算爆了”可以是”投资产生了回报,但回报的量化需要时间”。Uber能说出那两个具体数字,说明他们在某种程度上已经建立了这种度量能力。很多预算同样超支的企业,没有这种能力——钱花了,不知道换来了什么。
2026年的Agentic AI:五个行业正在发生的并行实验
在深入分析Uber和Gartner之前,有必要把视野放宽,看看同一时期其他行业的并行实验。这些案例共同验证了一个规律:凡是看到真实ROI的企业,都选择了”放大人”而非”替换人”的策略。
金融服务业的案例最能说明问题。Anthropic刚刚在纽约举办了针对银行和保险公司的专属发布会,推出了10套专为金融机构设计的AI代理——分为”研究与客户覆盖”和”财务与运营”两类。但Anthropic的战略负责人说得很清楚:这些代理是给银行分析师用的工具,不是取代银行分析师的机器。JPMorgan Chase的CEO Jamie Dimon亲自在台上演示了如何用Claude Code在20分钟内创建一套资产互换分析仪表盘,他的结论是”很准确”——但他没有说”我要因此裁减我的量化团队”。与此同时,FIS和Anthropic合作推出的Financial Crimes AI Agent把反洗钱调查从”数小时”压缩到”数分钟”,而FIS的表述同样是”让合规团队能够处理更多案例”,而不是”减少合规团队人数”。
企业IT与工单处理领域,ServiceNow的内部AI系统处理IT工单速度提升了99%。但ServiceNow同时推出了AI Control Tower,CEO Bill McDermott的解释意味深长:”AI作为工作者的时代开始了——而工作者需要被管理。”这个管理工具的存在,明确说明了人类角色的转变方向:不是退出,而是从执行者转变为监督者。ServiceNow分享的那个9秒删库案例,更是直接证明了监督的不可替代性。
软件开发行业,Netflix对3000多名工程师建立了成熟度模型,把”会使用AI工具”和”真正改变了软件交付方式”系统性地区分开来。Netflix的度量的不是”省了多少人力成本”,而是”有多少工程师真正通过AI改变了他们的工作效率”。从结果来看,Netflix的工程规模没有缩减,而是在同样的团队规模下实现了更高的交付速度。
这三个行业的共同逻辑,与Uber的案例高度一致,也与Gartner报告描述的成功企业画像高度吻合:增强人的能力,而不是替换人的位置。这不是巧合,而是Agentic AI在真实部署中反复验证的规律。
五种错误,五种代价:那80%企业的决策解剖
在理解”为什么大多数企业做错了”之前,需要先理解他们是怎么做出那个决定的。这不是愚蠢,而是一种系统性的认知偏差,在巨大的外部压力下被放大。
错误一:把AI演示当成AI现实。 每一个AI销售演示都经过精心设计:环境干净、任务边界清晰、输出令人印象深刻。但真实的企业环境是混乱的——数据质量参差不齐,系统间依赖关系复杂,用户的请求往往模糊而带有隐含上下文。从演示到生产部署,中间有一个巨大的鸿沟,而这个鸿沟的成本往往没有被计入ROI预测。
错误二:把裁员混淆成效率提升。 裁员降低了人力成本,这在财务报表上是立即可见的。但效率提升是另一件事,它需要时间来建立。当企业在效率真正提升之前就裁员,等于在收割还没成熟的庄稼——你减少了投入,但收益还没出现。
错误三:低估了新技能的需要。 Agentic AI的部署需要全新类型的技能:如何构建好的提示词工程,如何设计Human-in-the-loop的工作流,如何评估AI输出的质量,如何处理AI的边缘案例。这些技能不是天生的,需要培训,需要实践,需要时间。裁员缩减了可以学习这些技能的人,也缩减了未来人机协作的深度。
错误四:忽视了组织变革的摩擦成本。 用AI替换部分人力工作,不只是技术问题,也是组织变革问题。剩余员工的适应成本、工作流程的重新设计成本、管理模式的调整成本——这些都是真实的,都需要时间和资源。而这些成本在裁员决策时很少被纳入计算。
错误五:用短期财务逻辑解答长期竞争问题。 AI带来的竞争优势是长期的,它体现在几年后的市场份额、产品质量、客户满意度对比里,而不是当季的成本报表。如果用季报的时间框架来评估一个三年期的战略投资,答案永远是”成本太高、回报不明确”。
这五种错误不是孤立的,它们相互强化:压力之下的CEO需要快速显示成果,于是采用了最直接的手段(裁员),而这个手段的短期收益会在数月后衰减,长期竞争力却已经被削弱。
结语:代价和收益活在不同的时钟里
最后,回到那两句话放在一起时的真正含义。
“预算爆了”——这是一个事实,发生在2025年底到2026年春的某个时间点,出现在财务系统里,是可量化的、即时可见的。
“开始看到真实的结果了”——这个”开始”字很重要。不是”已经看到了全部结果”,是”开始”。这意味着收益的兑现是一个持续的过程,在代价已经发生之后,它还在继续实现中。
这两件事活在不同的时钟里。代价的时钟走得很快;收益的时钟走得比较慢。大多数企业、大多数CEO、大多数董事会,习惯了按季报的节奏思考问题。他们等不及收益的时钟走完,于是选择了一条看起来能在财务报表上立即呈现改善的路——裁员降本。
Gartner的数据告诉我们,这条路走不通,因为它把两个时区里的事情搞混了。裁员作用于”现在”,而AI真正的价值需要时间来兑现——需要工具成熟、员工适应、工作流程重塑,每一步都需要时间。
这不是说不能做人力调整。随着AI能力的提升,某些类型的工作确实会减少,这是现实。但这种调整应该是市场机制下的自然演进,而不是在AI能力还远未成熟时的激进行动。今天裁掉的那些人,很可能是三年后承担”管理AI系统”新角色的最合适人选——因为他们最了解业务,最了解那些AI仍然容易出错的边缘场景。
Uber的故事告诉我们,另一条路什么样:接受代价是即时的,相信收益会来,建立度量框架,等待两个时钟的钟面最终对齐。
这需要时间,这需要信念,这需要在账单超出预算时还能对CEO说”继续投”的CTO。
Praveen Neppalli Naga站在台上说”我们把预算烧完了,但我们开始看到结果了”——这句话背后是一种选择:宁可在代价的时区里承受压力,也不在收益的时区里剪断那根正在生长的绳子。
那80%做了另一种选择。他们选择了在代价的时区里用裁员来创造一个账面上的”收益”,但这个收益是虚假的——它消耗的是未来竞争力的一部分。
历史会判断哪种选择更值得。而在这个判断到来之前,那些选择了”放大人”而非”替换人”的企业,正在一天一天地积累它们的竞争优势。
这个差距,正在悄悄扩大。
参考资料
-
Sierra Raises $950M; Uber CTO: 10% of Code Now Autonomously Generated — TechCrunch, Connie Loizos, 2026年5月4日
https://techcrunch.com/2026/05/04/sierra-raises-950m-as-the-race-to-own-enterprise-ai-gets-serious/ -
Gartner Says Autonomous Business and AI Layoffs May Create Budget Room But Do Not Deliver Returns — Gartner官方新闻稿, 2026年5月5日
https://www.gartner.com/en/newsroom/press-releases/2026-05-05-gartner-says-autonomous-business-and-artificial-intelligence-layoffs-may-create-budget-room-but-do-not-deliver-returns -
AI Layoffs Backfire as Cutting Staff Doesn’t Cut It, Firms Warned — The Register, 2026年5月6日
https://www.theregister.com/ai-and-ml/2026/05/06/ai-layoffs-backfire-as-cutting-staff-doesnt-cut-it-firms-warned/5230631 -
Coinbase to Lay Off 14% of Staff as Part of Broader Restructuring — TechCrunch, 2026年5月5日
https://techcrunch.com/2026/05/05/coinbase-to-lay-off-14-of-staff-as-part-of-broader-restructuring/ -
ServiceNow Knowledge 2026: Autonomous Workforce, Otto, AI Control Tower — Fortune, 2026年5月5日
https://fortune.com/2026/05/05/servicenow-knowledge-2026-autonomous-workforce-microsoft-nvidia-ai-announcements/ -
ServiceNow Kill Switch for AI Agents: The 9-Second Database Deletion Warning — Fortune, 2026年5月6日
https://fortune.com/2026/05/06/servicenow-kill-switch-ai-agents-bill-mcdermott/ -
Code with Claude 2026: Netflix 3000+ Engineers and the Maturity Model — Simon Willison’s Weblog, 2026年5月6日
https://simonwillison.net/2026/May/6/code-w-claude-2026/