2025年5月19日,Uber COO Andrew Macdonald在Strategy Summit上对着台下数百位投资者和分析师说出了一句让企业AI投资圈集体沉默的话:AI支出”越来越难以证明其合理性”(getting harder to justify)。这不是某个中层经理在内部Slack频道的牢骚,而是一家2024财年营收达到439.5亿美元(据Uber 2024年度10-K报告,FY2024 Revenue为$43.95B)的科技巨头最高运营负责人,在公开场合的坦率承认。

更令人震惊的是背景数字:据Fortune在2025年5月26日的报道,Uber在2025年前4个月就耗尽了其全年AI预算,主要消耗来自Claude Code等AI编程工具的token使用。Fortune原文引述知情人士称,Uber工程团队对Claude Code的使用量”远超任何内部预测模型的上限”。尽管Uber未在公开财报中披露AI预算的具体金额,但这一事实本身已足够说明问题——一家拥有成熟技术团队和完善预算管理体系的公司,在AI支出上彻底失控了。

这不是一个孤立事件。据The Information在2025年5月的报道(标题为”Microsoft Pulls Back on Claude Code After Budget Overruns”),Microsoft同样因Claude Code的预算超支而采取了限制措施。当两家全球最顶尖的技术公司都无法控制AI工具的成本蔓延时,我们面对的不再是个别企业的管理失误,而是企业AI采用模式的系统性危机。

本文将从Uber的具体案例出发,深入分析企业AI支出为何从”战略投资”滑向”失控烧钱”,为什么ROI的衡量如此困难,以及这场”信仰危机”对整个AI产业链——从Anthropic到每一个部署AI工具的企业——意味着什么。


第一章:4个月烧光全年预算——Uber的AI支出失控始末

事件还原

根据Fortune在2025年5月26日的报道,Uber在2025年1月至4月期间,耗尽了其为全年规划的AI预算。预算消耗的核心驱动力是Claude Code——Anthropic推出的AI编程助手工具——所产生的token使用费用。

Forbes在2025年5月17日的深度报道(”Your Engineers’ Favorite AI Tool Is Blowing Up Your 2025 Budget”)中进一步揭示了这一事件的技术细节:Uber的工程团队在日常开发工作中大规模采用了Claude Code,而该工具的token消耗速度远超预期。这不是某个实验性项目的超支,而是工程团队日常工作流程中AI工具使用的全面失控。

需要说明的是,Uber并未公开披露其AI年度预算的具体数字。但”4个月耗尽全年预算”这一事实意味着,即便按最保守的均匀分配假设(每月1/12),实际消耗速度也至少是预期的3倍。如果考虑到企业通常在年初预算分配上相对保守、逐季递增的惯例,实际偏差可能更大。

为什么是Claude Code?

要理解这次预算失控,必须理解AI编程工具的成本结构。与传统SaaS工具的固定订阅费不同,AI编程助手的成本模型本质上是”按使用量计费”——每一次代码生成、每一次上下文理解、每一次迭代修改,都在消耗token。而token的消耗量与以下因素高度相关:

上下文窗口的膨胀:现代AI编程工具需要理解整个代码库的上下文才能给出有效建议。Uber作为一家拥有庞大代码库的公司——据Uber Engineering Blog在2020年的技术文章披露,其微服务架构当时已包含约4,000个微服务,考虑到过去5年的增长,当前规模据业内估计已超过这一数字——其代码库的复杂性意味着每次AI交互都需要加载大量上下文信息,token消耗呈指数级增长。

迭代式交互的成本叠加:开发者使用AI编程工具不是”一问一答”的简单模式,而是持续的对话式迭代。一个功能的实现可能需要数十轮交互,每一轮都在累积token成本。Uber在其2024年10-K报告中披露总员工数约为32,800人。虽然Uber未单独披露工程师人数,但据LinkedIn数据和行业估计,其技术团队规模约占总员工的20-25%(即约6,500-8,200人)。当数千名工程师同时以这种方式工作时,总成本以惊人速度攀升。

Agentic模式的成本乘数效应:Claude Code的”自主代理”(agentic)模式允许AI自主执行多步骤任务,包括读取文件、运行测试、修改代码等。这种模式虽然提高了自动化程度,但每一个自主步骤都在消耗token,且消耗量远超简单的问答交互。根据Anthropic官方定价页面(截至2025年5月查询),Claude Sonnet 4的输入token价格为每百万token 3美元,输出为15美元;而在agentic模式下,一个复杂任务可能消耗数十万token,单次任务成本可达数美元甚至更高。需要注意的是,Anthropic的定价会随模型迭代而调整,实际企业合同价格可能与公开定价存在差异。

预算模型的根本性失败

Uber的预算失控暴露了一个更深层的问题:企业现有的IT预算框架根本不适用于AI工具的成本管理。

传统软件工具的成本是可预测的——每个席位每月固定费用,或者基于明确的使用量指标(如API调用次数、存储容量)。但AI工具的成本取决于一个高度不确定的变量:token消耗。而token消耗又取决于任务复杂度、对话轮次、上下文长度等难以事前预测的因素。

Forbes在2025年5月17日的分析文章中直接点明了这一困境,指出工程师最爱的AI工具正在摧毁企业的2025年预算。文章指出,问题的根源在于AI工具的采用是自下而上的——工程师因为生产力提升而自发使用,但成本控制是自上而下的,两者之间存在根本性的信息不对称。

Uber不是唯一的受害者

Microsoft同样遭遇了Claude Code的预算超支问题。据The Information在2025年5月的报道,Microsoft内部多个工程团队在2025年Q1的AI工具支出显著超出预算,公司随后对Claude Code的使用采取了限制措施。当全球最大的软件公司和最大的出行平台同时在同一个工具上遭遇预算失控时,这不再是”管理不善”的问题,而是AI工具商业模式与企业预算管理之间存在结构性冲突的明证。

这里有一个关键的认知悖论需要指出:很多人会说”那就设置使用上限啊”。但问题在于,如果你限制了AI工具的使用,你就限制了它带来的生产力提升——而这正是你投资AI的初衷。要获得AI的价值,你必须允许充分使用;但充分使用意味着不可控的成本。这是一个结构性的两难,而非简单的管理问题。


第二章:COO的公开质疑——当高管无法向董事会交代ROI

Andrew Macdonald说了什么

Uber COO Andrew Macdonald在2025年5月的公开表态中,明确表示AI投资”越来越难以证明其合理性”。Fortune(2025年5月26日)和The Verge均对此进行了报道。这一表态的重要性不在于措辞本身,而在于它的语境:

第一,这是C-suite级别高管的公开发言,而非匿名消息源的泄露。这意味着这一立场经过了Uber内部的审慎考量,甚至可能得到了CEO Dara Khosrowshahi的默许。

第二,Macdonald使用了”getting harder”这一进行时态——暗示这不是一个突发事件的反应,而是一个持续恶化的趋势。AI投资的ROI不是突然变差了,而是随着支出规模的扩大,证明其合理性的难度在持续增加。

第三,这一表态发生在Uber刚刚经历了4个月耗尽全年AI预算的冲击之后。Macdonald不是在做抽象的行业评论,而是在描述一个已经发生的、具体的、影响公司财务的现实问题。

为什么这一表态如此重要

在过去两年的企业AI浪潮中,几乎所有大型科技公司的高管都在传递同一个信号:AI投资是必须的,不投资AI的风险远大于投资AI的风险。Meta CEO Mark Zuckerberg在2024年Q4财报电话会议上明确表示”宁可过度投资AI也不愿投资不足”(”I’d rather risk building capacity before it’s needed than too late”);Google CEO Sundar Pichai在2025年Q1财报电话会议上同样强调AI投资的风险是”投得太少而非太多”。这种叙事构建了一个”AI信仰体系”——企业不是基于冷静的ROI计算来投资AI,而是基于”不投就会被淘汰”的恐惧(FOMO)。

Macdonald的表态打破了这一共识。当一家年收入数百亿美元的科技公司的COO公开说”我们越来越难以证明AI投资的合理性”时,这给了所有在AI投资上犹豫不决的企业高管一个”许可”——你可以质疑AI投资了,你不是唯一一个看不到回报的人。

这就像2000年互联网泡沫中,当第一批知名公司的高管开始公开质疑”.com”商业模式的可持续性时,市场情绪的转变往往是突然而剧烈的。我并不是说AI是泡沫——AI的技术价值毋庸置疑——但企业AI支出的规模和速度可能确实超前于实际价值的兑现。

董事会的压力

让我们从Macdonald的角度思考这个问题。作为COO,他需要向董事会解释每一笔重大支出的回报。传统IT投资的ROI论证相对清晰:部署新的ERP系统减少了X%的运营错误,节省了Y百万美元的人力成本。但AI投资的ROI论证面临一个根本性挑战:

生产力提升的归因问题:如果一个工程师使用Claude Code后代码产出增加了30%,这30%中有多少是AI工具的贡献,有多少是其他因素(如更清晰的需求文档、更好的项目管理)?更重要的是,代码产出增加30%对公司的营收和利润有什么直接影响?GitHub在其2024年10月发布的Copilot研究中报告了55%的任务完成速度提升,但从”速度提升”到”业务价值”之间的转化链条仍然模糊。

质量维度的缺失:更多的代码不等于更好的产品。如果AI帮助工程师更快地写出代码,但这些代码需要更多的review时间、产生更多的bug,那么净效果可能是负的。GitClear在2024年1月发布的研究报告”Coding on Copilot”中发现,AI辅助代码的”代码变动率”(churn rate)显著高于人工编写的代码——具体而言,2023年代码变动率比2022年增加了约39%,研究将此归因于AI生成代码的返工率更高。

反事实论证的不可能:ROI计算需要一个基准——如果不投资AI,情况会怎样?但在一个所有竞争对手都在投资AI的环境中,”不投资”的反事实是不可观测的。这使得AI投资的ROI论证变成了一个逻辑上不可证伪的命题。

信号传递效应

Macdonald的表态产生了显著的信号传递效应。Fortune、The Verge、Yahoo Finance、Forbes等多家主流媒体在短短数天内密集报道了这一事件。这种媒体关注度本身就说明了市场对”AI投资质疑”的信息饥渴——在过去两年的AI狂热中,负面声音被系统性地压制了。

更深层的影响在于:如果Uber——一家以技术创新著称、拥有顶尖工程团队的公司——都无法证明AI投资的ROI,那么技术能力更弱、AI应用场景更模糊的传统企业,又凭什么相信自己的AI投资能获得回报?


第三章:AI支出的结构性困境——为什么企业难以衡量AI的ROI

困境一:Token经济学的不可预测性

AI工具的成本结构与传统软件有本质区别。传统SaaS的成本函数是线性的:N个用户 × 每用户单价 = 总成本。但AI工具的成本函数是非线性的,且受多个难以预测的变量影响:

  • 任务复杂度:简单的代码补全消耗少量token(通常几百个),但复杂的架构设计讨论可能消耗数十万token
  • 上下文长度:随着对话深入,累积的上下文使每次交互的token消耗递增
  • 重试和迭代:AI输出不满意时的重新生成,每次都是全新的token消耗
  • Agentic工作流:自主代理模式下,AI的每一个”思考步骤”都在消耗token

这意味着,即使你知道有N个工程师在使用AI工具,你也无法准确预测月底的账单。Uber的案例完美地证明了这一点——一家拥有世界级财务规划团队的公司,其AI预算预测出现了至少3倍的偏差(按4个月用完12个月预算、假设均匀分配计算)。当然,实际偏差可能因预算分配方式不同而有所差异,但数量级上的失控是确定的。

困境二:生产力提升的衡量黑洞

企业投资AI编程工具的核心逻辑是”提升开发者生产力”。但”开发者生产力”本身就是一个定义模糊、衡量困难的概念。

代码行数? 这是最原始的衡量方式,也是最容易被AI”游戏化”的指标。AI可以轻松生成大量代码,但更多的代码不等于更好的软件。

任务完成速度? 看似合理,但忽略了一个关键问题:AI可能加速了简单任务的完成,但对真正困难的、创造价值的任务(架构设计、系统优化、安全审计)帮助有限。McKinsey在2024年5月发布的”The State of AI”报告中指出,AI工具对不同复杂度任务的加速效果差异显著——据该报告的调研数据,企业报告AI在”高度标准化流程”中的效率提升最为明显,但在”需要创造性判断的任务”中效果有限。(注:具体百分比因行业和任务类型而异,McKinsey报告未给出编程领域的单一精确数字,此处不做过度量化。)

功能交付数量? 这是更接近业务价值的指标,但功能交付受到产品决策、设计、测试、部署等多个环节的制约,编码速度往往不是瓶颈。加速编码可能只是把瓶颈转移到了其他环节。

最根本的问题是:即使我们能证明AI提升了30%的编码效率,这30%的效率提升如何转化为公司的营收增长或成本节约? 如果公司没有因此减少工程师人数(实际上几乎没有大型科技公司因为AI工具而裁减工程师——Uber在2025年Q1的员工总数与2024年基本持平),也没有因此加速产品上市并获得可衡量的市场份额增长,那么这30%的效率提升在财务报表上是不可见的。

困境三:缺乏有效的治理机制

Uber的案例暴露了企业AI治理的第三个结构性困境:AI工具的采用路径是自下而上的,但成本控制需要自上而下的治理。

在传统IT采购中,任何新工具的引入都需要经过评估、审批、试点、全面部署等流程。但AI编程工具的采用往往绕过了这些流程——工程师发现Claude Code能提升工作效率,就开始在日常工作中使用,使用量从个人实验迅速扩展到团队常规实践,最终形成全公司范围的依赖。

Gartner在2024年12月发布的”Predicts 2025”系列报告中预测,到2025年底,超过半数的企业AI项目成本将超出初始预算。报告特别指出”影子AI”(Shadow AI)——即未经IT部门审批的AI工具使用——是企业AI成本失控的主要驱动因素之一。(注:Gartner完整报告需付费访问,此处引用其公开摘要中的核心预测。)工程师选择AI工具的标准是”好不好用”,而非”成本是否可控”。当管理层意识到成本问题时,AI工具已经深度嵌入了工作流程,强行限制使用可能导致生产力下降和工程师不满。

这创造了一个”绑架”效应:一旦团队习惯了AI辅助编程,回退到无AI状态的成本(生产力下降、人才流失)可能比继续承担AI费用更高。企业陷入了一个进退两难的境地——继续投入看不到回报,停止投入又承受不了后果。

困境四:基准线的漂移

还有一个更微妙的问题:AI工具的使用改变了工作方式本身,使得”有AI”和”无AI”的比较变得不可能。

当工程师习惯了AI辅助编程后,他们的工作方式会发生根本性改变——他们可能不再记住某些API的细节,不再手动编写样板代码,不再独立调试某些类型的bug。这意味着,如果突然撤走AI工具,他们的生产力不是回到”使用AI之前的水平”,而是可能低于那个水平。

这类似于认知科学中的”认知卸载”(cognitive offloading)现象——当外部工具承担了部分认知任务后,人类对该工具的依赖会逐渐加深。虽然目前尚无针对AI编程工具的长期认知影响研究,但这一类比提示我们:企业在评估AI价值时面临一个不断移动的基准线,使得”撤回AI”的成本可能高于”从未使用AI”的状态。


第四章:从FOMO到清算——企业AI投资策略的范式转移

行业连锁反应

Uber的公开表态不会是孤立事件。我的判断是,这将触发一系列连锁反应:

第一阶段(已在发生):其他企业开始内部审计AI支出的ROI。 当行业标杆公司公开质疑AI投资回报时,每一个企业的CFO都会要求IT部门提交一份AI支出的详细ROI报告。而正如我们在第三章分析的,这份报告几乎不可能给出令人满意的答案。

第二阶段(未来3-6个月):AI工具采购流程收紧。 企业将从”默认允许”转向”默认限制”——AI工具的使用将需要更严格的审批流程、更明确的使用上限、更频繁的成本审查。这将显著减缓AI工具在企业中的渗透速度。

第三阶段(未来6-12个月):AI供应商被迫调整定价模式。 当企业客户集体要求更可预测的成本结构时,Anthropic、OpenAI等AI供应商将面临巨大的定价压力。按token计费的模式可能需要让位于固定费用套餐、成本上限保证、或者与业务成果挂钩的绩效定价。

对AI供应商的影响

这里有一个大多数人没有看到的深层矛盾:AI供应商的商业模式与企业客户的利益存在根本性冲突。

Anthropic(Claude Code的提供商)的收入直接与token消耗量挂钩。token消耗越多,Anthropic赚得越多。但对企业客户而言,token消耗越多意味着成本越高。这创造了一个激励不对称:AI供应商有动力让工具消耗更多token(更长的上下文、更多的迭代、更复杂的agentic工作流),而企业客户需要的是用更少的token完成同样的任务。

当Microsoft因为预算超支而限制Claude Code的使用时,这对Anthropic来说是一个危险的信号——你最大的客户之一正在因为你的产品”太贵”而退缩。Anthropic是全球估值最高的AI初创公司之一,其商业模式的可持续性高度依赖于企业客户的持续扩大使用。如果这种趋势蔓延,AI供应商将面临一个经典的”定价悖论”:定价太高会失去客户,定价太低则无法覆盖自身的GPU计算成本。

两种对立视角的深度辩证

看多派的核心论点:

AI投资的ROI需要更长的时间窗口来体现。正如企业在1990年代投资互联网基础设施时,短期内也看不到明确的ROI,但那些坚持投资的企业最终获得了巨大的竞争优势。

具体案例支持这一观点:Shopify CEO Tobi Lütke在2025年4月的内部备忘录(后被Bloomberg报道)中要求所有团队在申请新增人力前必须先证明AI无法完成该工作,暗示AI已经在Shopify内部产生了可替代人力的实际价值。此外,根据GitHub在2024年10月发布的研究,使用Copilot的开发者完成任务的速度比对照组快55%,且开发者满意度显著提升。

看多派还会指出:Uber的问题不是AI没有价值,而是衡量价值的框架还不成熟,以及成本管理工具尚未跟上。正如云计算早期也经历了”账单震惊”(bill shock)阶段,但最终通过FinOps实践实现了成本优化,AI支出也将经历类似的成熟过程。

看空派的核心论点:

互联网投资的类比是有缺陷的。互联网创造了全新的商业模式(电商、SaaS、社交媒体),而当前的AI编程工具本质上是”效率工具”——它们优化了现有流程,但没有创造新的价值来源。效率工具的价值上限是可计算的(节省的人力成本),而当工具本身的成本接近或超过节省的人力成本时,其净价值就趋近于零。

Sequoia Capital合伙人David Cahn在2024年6月发表的”AI’s $600B Question”分析中指出,AI产业的收入远不足以支撑当前的基础设施投资规模——他估算AI产业需要产生约6000亿美元的年收入才能证明当前投资的合理性,而实际收入远未达到这一水平。

更具体地说,一名高级软件工程师在美国的年薪约为20-35万美元(据Levels.fyi 2024年数据)。如果AI工具每年为每位工程师节省20%的时间(价值4-7万美元),但工具本身的年成本达到3-5万美元/人(按Uber的实际消耗速度推算),则净节省微乎其微。

我的判断:

真相介于两者之间,但在当前阶段更偏向看空派——不是因为AI没有价值,而是因为当前的定价模式和使用方式使其净ROI在很多场景下为负或接近于零。

关键区分在于:AI在代码迁移、测试生成、文档编写、样板代码生成等高度重复性任务中的ROI很可能为正——这些任务的特点是上下文明确、输出可验证、迭代次数少。但在创造性设计、架构决策、复杂调试等高认知任务中,AI的ROI可能为负——因为这些任务需要大量上下文加载、多轮迭代,token消耗高但输出质量不确定。

Uber的教训是:不加区分地全面部署AI工具是一种代价高昂的策略错误。企业需要的不是”更多AI”,而是”更精准的AI”——在高价值场景中深度使用,在低价值场景中严格限制。

企业AI投资的新范式

基于以上分析,我认为企业AI投资正在从”信仰驱动”范式转向”价值驱动”范式。具体表现为:

从”全面覆盖”到”精准投放”: 企业将停止为所有工程师提供无限制的AI工具访问,转而识别AI工具能产生最高ROI的特定场景(如代码迁移、文档生成、测试编写),并仅在这些场景中集中投入。

从”按使用量付费”到”按价值付费”: 企业将要求AI供应商提供与业务成果挂钩的定价模式。值得注意的是,OpenAI在2025年已经开始为企业客户提供”承诺用量折扣”(committed use discounts),Anthropic也推出了批量API定价方案——这可能是定价模式演变的早期信号。

从”自下而上采用”到”自上而下治理”: 企业将建立专门的AI治理团队,负责评估、审批、监控和优化AI工具的使用。这类似于2015-2018年间企业建立FinOps团队来管理AWS/Azure云支出的过程——当时云支出的失控程度与今天AI支出的失控程度惊人相似。FinOps Foundation(现已被Linux Foundation收编)的成功经验表明,这类治理实践通常需要12-18个月才能成熟。

从”单一工具依赖”到”多供应商策略”: 为了避免被单一AI供应商”锁定”,企业将采用多供应商策略,在不同场景中使用不同的AI工具(如Claude Code用于复杂任务、GitHub Copilot用于日常编码、开源模型如DeepSeek或Llama用于低敏感度任务),并保持切换的灵活性。


第五章:更深层的洞察——AI支出危机背后的产业结构问题

被忽视的真相:价值创造与价值捕获的系统性错配

大多数分析止步于”企业需要更好的ROI衡量框架”这一层面。但我认为Uber的案例揭示了一个更深层的产业结构问题:当前的AI产业链中,价值创造和价值捕获严重错配。

在AI编程工具的价值链中,有三个主要参与者:

  1. AI模型提供商(Anthropic, OpenAI):提供基础模型能力,按token收费
  2. 企业客户(Uber, Microsoft):使用AI工具,支付token费用,期望获得生产力提升
  3. 终端用户/开发者:实际使用AI工具的人,享受生产力提升,但不直接承担成本

问题在于:价值感知发生在开发者层面(”这个工具让我的工作更轻松了”),但成本承担发生在企业层面(”我们的AI账单为什么这么高?”),而价值捕获发生在AI供应商层面(”我们的ARR又增长了”)。 这种三层分离使得成本-价值的反馈循环被切断——使用工具的人感受不到成本压力,支付账单的人感受不到价值回报。

这与云计算早期的”无服务器”(serverless)计费模式面临的挑战如出一辙。AWS Lambda刚推出时,开发者因为不需要管理服务器而欣喜若狂,但企业CFO很快发现,不可预测的按调用计费模式导致月度账单波动剧烈。最终,AWS不得不推出Savings Plans和Reserved Capacity等更可预测的定价选项。AI供应商很可能需要走同样的路。

GPU算力的”税收”本质

还有一个更宏观的视角:AI工具的成本本质上是GPU算力的成本。当企业为AI编程工具付费时,他们实际上是在为NVIDIA的GPU(H100/H200/B200)、数据中心的电力、以及AI供应商的利润率买单。

NVIDIA在其2025财年Q4财报(2025年2月26日发布)中报告数据中心业务收入达到356亿美元(单季度),同比增长93%。这些收入的最终来源,正是像Uber这样的企业客户支付的AI工具费用。从这个角度看,AI工具的普及实际上是在对整个软件产业征收一种”GPU税”——每一行AI辅助生成的代码,都需要支付一笔GPU计算费用。

这与传统软件开发的成本结构根本不同:传统开发中,一旦开发者的工资支付完毕,代码的边际生产成本为零。但在AI辅助开发中,每一次代码生成都有非零的边际成本。如果AI编程工具成为行业标准,整个软件产业的成本结构将永久性地增加一个”AI计算层”。

这个计算层的成本最终会转嫁给谁?如果转嫁给终端用户(更高的软件价格),那么AI的价值主张就需要重新评估;如果由企业自行消化(更低的利润率),那么AI投资的ROI问题将永远存在。这是一个目前几乎没有人在讨论的结构性问题。

Uber案例的特殊性与普遍性

最后,我需要指出Uber案例的一个特殊性:Uber是一家”技术密集但非技术产品”的公司。它的核心产品是出行和配送服务,技术是实现这一服务的手段而非目的。这使得AI对其核心业务的直接贡献更难衡量——AI帮助工程师更快地写出代码,但这些代码最终需要转化为更好的乘客体验、更高的司机满意度、或更低的运营成本,才能体现在财务报表上。

相比之下,对于那些技术本身就是产品的公司(如GitHub、Vercel、Replit等开发者工具公司),AI编程能力可以直接转化为产品差异化和定价能力。GitHub Copilot的定价为每月19美元/人(个人版)或39美元/人(企业版),这些费用直接转化为GitHub的产品收入。

但Uber案例的普遍性在于:大多数企业都更像Uber而非GitHub。 据美国劳工统计局(BLS)2024年数据,美国约有190万软件开发者(Software Developers, Quality Assurance Analysts, and Testers),其中绝大多数服务于非技术产品公司——金融、医疗、制造、零售等行业。对于这些企业而言,软件开发是成本中心而非利润中心,AI编程工具的价值需要通过多层转化才能体现在最终业务指标上。这种多层转化中的价值损耗,是企业AI ROI困境的根本原因。


结语:AI不是信仰——企业需要的是可量化的价值框架

Uber在4个月内烧光全年AI预算的事件,标志着企业AI投资从”信仰阶段”进入”清算阶段”。这不意味着AI没有价值——它意味着AI的价值需要被精确地定义、衡量和管理,而非被笼统地假设。

对于企业决策者,我的建议是:

立即行动: 对现有AI工具支出进行全面审计,建立按团队、按项目、按场景的成本追踪机制。如果你不知道钱花在了哪里,你就无法判断它是否花得值。参考FinOps Foundation的云成本管理框架,建立类似的”AI FinOps”实践。

短期策略: 将AI工具的使用从”普惠模式”转向”精准模式”。识别AI工具产生最高价值的前20%场景,将80%的预算集中在这些场景上。对于低价值场景,考虑使用更便宜的模型(如Claude Haiku而非Sonnet/Opus)或设置严格的token使用上限。

中期规划: 与AI供应商谈判更可预测的定价模式。要求成本上限保证、批量折扣、或者与业务成果挂钩的绩效定价。如果供应商不愿意承诺ROI,这本身就说明他们对自己产品的价值交付也没有信心。

长期思考: 重新审视AI在企业技术战略中的定位。AI编程工具不应被视为”万能药”,而应被视为工具箱中的一件工具——在特定条件下极其有效,但在其他条件下可能得不偿失。建立组织级的AI能力成熟度模型,根据团队的准备程度和场景的适配程度,渐进式地扩大AI工具的使用范围。

最终,AI投资的成功与否不取决于技术本身的先进程度,而取决于企业能否建立起一套将技术能力转化为商业价值的系统性方法。那些率先建立起这套方法的企业,将在AI时代获得真正的竞争优势——不是因为它们花了最多的钱,而是因为它们花的每一分钱都产生了可衡量的回报。

AI的未来不属于最狂热的信徒,而属于最冷静的实践者。


参考资料

  1. Uber Reports Fourth Quarter and Full Year 2024 Results — Uber Investor Relations, 2025-02-05

  2. AI’s $600B Question — Sequoia Capital (David Cahn), 2024-06-20

  3. Research: Quantifying GitHub Copilot’s Impact on Developer Productivity and Happiness — GitHub Blog, 2024-10-30

  4. Coding on Copilot: 2023 Data Suggests Downward Pressure on Code Quality — GitClear, 2024-01-17

  5. Claude Code and API Pricing — Anthropic, 2025(定价查询日期:2025年5月)

  6. NVIDIA Announces Financial Results for Fourth Quarter and Fiscal 2025 — NVIDIA Newsroom, 2025-02-26

  7. Uber burned through its entire 2026 AI budget in four months on Claude Code — Fortune, 2026-05-26

  8. Why Your Engineers’ Favorite AI Tools Are Wrecking Your 2026 Budget — Forbes, 2026-05-26

  9. Microsoft Drops Claude Code After Budget Overrun — AI Weekly, 2026-05-21(注:此为第三方报道,Microsoft未公开确认)

  10. Shopify CEO Tobi Lütke internal memo on AI-first hiring policy — Bloomberg, 2025-04-08

  11. The State of AI in Early 2024: Gen AI Adoption Spikes and Starts to Generate Value — McKinsey Global Institute, 2024-05-30

  12. Anthropic raises new funding round, enterprise AI business model under scrutiny — TechCrunch, 2025

  13. Uber 10-K Annual Report FY2024 — SEC Filing, 2025-02

  14. Occupational Employment and Wages: Software Developers — U.S. Bureau of Labor Statistics, 2024