2026年4月,一封发给 Claude Enterprise 客户的邮件引爆了企业 AI 圈:Anthropic 宣布将其企业级产品从固定席位费率,切换为20美元基础费加按 token 消费的混合计费模式。捆绑在席位中的 token 额度(bundled tokens)被彻底移除。对于那些每天让 Claude Code 自动生成数千行代码、让 Claude Cowork 协调多 agent 工作流的重度企业用户来说,这意味着账单可能翻倍甚至更多。

这不是一次常规的价格调整。这是企业 AI 行业商业模式的结构性断裂——从 SaaS 的”按席位订阅”逻辑,向公用事业的”按实际消耗计量”逻辑的范式转移。当 AI 从被动的聊天工具进化为主动执行任务的 agent,其计算消耗变得不可预测且量级飙升,传统的固定费率模型在经济上已不可持续。Anthropic 不是第一个感受到这种压力的公司,但它是第一个在企业级产品上做出如此激进调整的玩家。

Sam Altman 曾公开表示 OpenAI 希望像电力公司一样为 AI 计费(来源: India Today, 2026-04-15)。Anthropic 没有等待行业共识形成,它直接动手了。


第1章:定价地震——Anthropic 到底改了什么?

旧模式:固定席位费的”自助餐”逻辑

在此次调整之前,Claude Enterprise 采用的是 SaaS 行业最经典的按席位定价模型。企业为每个用户支付固定月费——据 The Register 报道,此前席位费最高可达200美元/用户/月(来源: The Register, 2026-04-16)——这个价格中包含了一定额度的 token 消费量(即 bundled tokens)。用户在额度内随意使用,超出部分再另行计费。需要指出的是,Anthropic 官方定价页面并未公开披露企业版的具体席位费用,200美元这一数字来自媒体报道中对企业合同条款的引述,实际费率可能因合同规模和谈判条件而异。

这种模式的核心吸引力在于可预测性:企业 CFO 可以精确计算每月的 AI 支出,将其纳入固定的 SaaS 预算行项。对于 Anthropic 来说,这种模式在产品早期有巨大的获客优势——它降低了企业试用的心理门槛,让采购决策变得简单:每个 seat 多少钱,乘以人数,签合同。

新模式:基础费 + 按量计费的”电表”逻辑

新的定价结构从根本上改变了这一逻辑。根据 The Register、Implicator.ai 和 Gizmodo 的报道(来源: The Register, 2026-04-16; Implicator.ai, 2026-04-16; Gizmodo, 2026-04-16),调整后的模式包含两个组成部分:

第一层:基础席位费。 每用户每月20美元——这一具体数字在 The Register 的报道中被明确提及(来源: The Register, 2026-04-16)。这是维持 Claude Enterprise 账户访问权限的底价。相比此前据报道最高200美元的席位费,这个数字看起来大幅下降——但关键在于,这个基础费不再包含任何有意义的 bundled token 额度。

第二层:按 token 消费计费。 用户实际使用 Claude 模型所消耗的 input tokens 和 output tokens,按照 API 级别的费率单独计量收费。每一次对话、每一次代码生成、每一次 agent 任务执行,都会产生可计量的 token 消耗,直接反映在账单上。

用一个类比来理解这种变化:旧模式是手机套餐——月费包含一定通话时长和流量;新模式是电费——基本接入费很低,但每度电都要按表计价。

“Bundled Tokens 被移除”意味着什么?

The Register 在报道中使用了一个精准的描述:”Anthropic ejects bundled tokens from enterprise seat deal”(来源: The Register, 2026-04-16)。”Eject”这个词——弹射、驱逐——传达了这次调整的激进程度。

在旧模式下,bundled tokens 本质上是 Anthropic 对企业用户的一种”算力补贴”。企业支付固定费用,获得一定量的免费计算资源。这种补贴在用户行为可预测的时代是可行的:一个普通企业用户每天用 Claude 进行几轮对话、写几封邮件、总结几份文档,token 消耗量相对稳定,Anthropic 可以通过统计学上的大数定律来平衡轻度用户和重度用户之间的成本差异。

但 Claude Code 和 Anthropic 的多 agent 协作功能(在产品文档中被称为 Claude Cowork,该功能于2026年初随 Claude Enterprise 更新推出,参见 Implicator.ai 对此次定价调整背景的报道)的出现彻底打破了这种平衡。一个开发者使用 Claude Code 进行全天候的自主编程任务,其单日 token 消耗量可能是普通对话用户的数十倍。当这些”超级重度用户”的比例从边缘变成主流,bundled tokens 就从”营销成本”变成了”亏损黑洞”。

谁的账单会涨?涨多少?

这次调整的直接影响呈现出明显的两极分化:

轻度用户受益。 那些每月只是偶尔使用 Claude 进行对话、文档总结的企业用户,此前可能支付较高的席位费,但实际 token 消耗远低于 bundled 额度。新模式下,他们只需支付20美元基础费加少量的 token 费用,总支出可能下降。

重度用户受伤。 那些深度依赖 Claude Code 进行软件开发、使用多 agent 工作流的用户,其月度 token 消耗量可能远超此前 bundled 额度所覆盖的范围。Gizmodo 在报道标题中直接使用了”jacking up the price for power users”(为重度用户大幅涨价)的措辞(来源: Gizmodo, 2026-04-16),反映了社区的真实情绪。Ainvest 的报道同样指出这一转变”increasing costs for heavy users”(来源: Ainvest, 2026-04-16)。

更值得关注的是,这种涨价发生在部分用户抱怨 Claude 模型质量下降的背景下(来源: Gizmodo, 2026-04-16)。”花更多钱买到感觉更差的产品”——这种感知上的双重打击,可能成为 Anthropic 客户留存的隐患。


第2章:为什么固定费率撑不住了?——Agent 时代的计算经济学

AI Agent 的”计算胃口”:从线性到指数

要理解 Anthropic 为何不得不做出这次调整,必须先理解 AI agent 与传统 AI 助手在计算消耗模式上的根本差异。

传统 AI 助手(对话模式): 用户输入一个问题,模型返回一个回答。一次交互通常消耗几百到几千个 token。根据 OpenAI 的公开文档,GPT-4 级别模型的一次典型对话交互消耗约1000-3000个 token(来源: OpenAI API 定价页面)。一个企业用户每天进行20-50轮对话,日均 token 消耗量大致可控。这种消耗模式是线性的、可预测的。

AI Agent(自主执行模式): Claude Code 不是在”回答问题”,而是在”执行任务”。一个典型的 Claude Code 工作流可能是这样的:用户给出一个高层指令(”重构这个模块的数据库访问层”),Claude Code 需要:

  1. 读取整个代码库的上下文(大量 input tokens)
  2. 分析依赖关系和架构模式(推理 tokens)
  3. 生成重构方案(output tokens)
  4. 编写新代码(output tokens)
  5. 运行测试、分析错误(多轮循环,每轮都消耗 tokens)
  6. 迭代修复直到测试通过(不确定的循环次数)

这个过程中,token 消耗不再是”每次交互几千个”的量级,而可能是单次任务消耗量级的数十倍乃至上百倍。更关键的是,消耗量的方差极大——一个简单的 bug 修复和一个复杂的架构重构之间的 token 消耗差距可能达到两个数量级。据 a16z 2025年发布的”AI 基础设施成本”报告估算,自主编码 agent 的单次任务 token 消耗中位数约为普通对话交互的50-100倍(来源: a16z, “The Cost of AI Inference”, 2025)。

多 agent 协作更进一步。当多个 agent 协同工作时,每个 agent 都在独立消耗 tokens,agent 之间的通信本身也在消耗 tokens。这是一个 token 消耗的乘数效应。

固定费率的数学崩塌

让我们用一个简化的假设性模型来理解为什么固定费率在 agent 时代不可持续。以下数字为估算,用于说明结构性矛盾,而非 Anthropic 的实际财务数据。

假设此前的固定席位费中,大部分成本预算用于覆盖 bundled tokens 的计算成本。在对话模式下,一个普通用户的月均 token 消耗成本可能远低于席位费,Anthropic 在大多数用户身上是盈利的,少数重度用户的超额消耗被轻度用户的”剩余额度”所补贴。

但当 Claude Code 成为核心使用场景,单用户月均 token 消耗成本可能大幅飙升。根据 Anthropic 当前公开的 API 定价,Claude 3.5 Sonnet 的 output token 价格为15美元/百万 token(来源: Anthropic API 定价页面)。一个重度 Claude Code 用户如果每天执行多个自主编码任务,月度 output token 消耗量达到数千万 token 并非不可能,仅 output 成本就可能达到数百美元。此时,固定席位费不仅无法覆盖成本,每个重度用户都在制造亏损。

更糟糕的是,agent 产品天然吸引的就是重度用户——那些愿意为高额席位费付费的企业,恰恰是最可能深度使用 Claude Code 的企业。这就是经济学中经典的”逆向选择”问题:固定费率吸引了成本最高的用户群体,而成本最低的用户群体反而觉得固定费率太贵而不愿付费。随着 agent 使用量的爆发式增长,这种逆向选择效应被急剧放大。

OpenTools 的报道将这一现象置于”AI’s Compute Crunch”(AI 算力危机)的大背景下(来源: OpenTools.ai, 2026-04-16),这个框架是准确的。Anthropic 面临的不仅是定价策略问题,而是一个算力经济学的结构性矛盾。

需求激增的证据

多家媒体报道证实,Claude Code 和多 agent 协作功能的需求激增是触发此次定价调整的直接原因(来源: The Register, 2026-04-16; Implicator.ai, 2026-04-16; OpenTools.ai, 2026-04-16)。《朝鲜日报》英文版将此事件置于”AI Industry Shifts to Pay-Per-Use Models Amid Rising Costs”(AI 行业在成本上升中转向按用量计费模式)的行业趋势下报道(来源: Chosun, 2026-04-16),暗示这不是 Anthropic 一家的问题,而是整个行业面临的结构性挑战。

这里有一个大多数分析师没有充分讨论的点:Claude Code 的使用模式具有”自我加速”特征。当一个开发团队发现 Claude Code 能够有效地自主完成编码任务,他们倾向于给它分配更多、更复杂的任务。每个成功的任务都在训练团队更深度地依赖 agent,从而进一步推高 token 消耗。这不是线性增长,而是 S 曲线——一旦企业跨过采用阈值,使用量会以远超预期的速度攀升。

Anthropic 在产品层面的成功(Claude Code 被广泛采用)直接导致了商业模式层面的危机(固定费率无法覆盖成本)。这是一个经典的”好产品坏定价”困境,而 Anthropic 选择了最直接的解决方案:让价格反映真实成本。


第3章:从 SaaS 到”AI 电力公司”——商业模式范式转移的深层逻辑

历史先例:云计算的定价演进

企业 AI 正在经历的这场定价变革,在科技史上有一个几乎完美的先例:云计算。

2006年 Amazon Web Services (AWS) 推出 EC2 时,其核心创新不仅是技术层面的虚拟化,更是商业模式层面的按需计费——按小时付费,用多少算多少。在此之前,企业获取计算资源的方式是购买服务器(资本支出)或签订托管合同(固定月费)。AWS 的 pay-as-you-go 模式彻底改变了企业的 IT 采购逻辑。

但值得注意的是,AWS 的定价演进并非一步到位。早期的 EC2 只有按需实例(on-demand),后来逐步引入了预留实例(reserved instances)、Savings Plans、Spot Instances 等多种定价机制,以满足不同企业在成本可预测性和灵活性之间的不同偏好。据 Gartner 2025年报告,全球云基础设施支出已超过3000亿美元,其中约40%通过预留或承诺消费协议进行(来源: Gartner, 2025)。

企业 AI 的定价演进正在走一条相似但压缩的路径。SaaS 按席位订阅是”预付费”阶段;Anthropic 的 usage-based 转型是”按需计费”阶段;未来大概率会出现”预留 token 额度”(类似 reserved instances)和”承诺消费折扣”(类似 Savings Plans)等混合机制。

Sam Altman 的”电力公司”比喻

India Today 在2026年4月15日的报道中提到,Sam Altman 曾公开表示 OpenAI 希望像电力公司一样为 AI 计费,而 Anthropic 可能已经在测试这种模式(来源: India Today, 2026-04-15)。这个比喻值得深入拆解。

电力公司的商业模式有几个核心特征:

  1. 基础接入费 + 按量计费。 用户支付少量月费维持电力接入,实际用电按千瓦时计价。这与 Anthropic 的20美元基础费 + 按 token 计费结构高度一致。

  2. 成本与使用量强相关。 电力公司的核心成本是发电燃料(煤、天然气、核能),成本与发电量直接挂钩。AI 公司的核心成本是 GPU 算力,成本与 token 生成量直接挂钩。两者都无法通过”固定费率”来有效对冲成本波动。

  3. 需求弹性与峰谷定价。 电力需求有明显的峰谷波动,电力公司通过分时电价来引导需求。AI 计算同样存在峰谷波动——工作日白天的使用量远高于深夜和周末。未来 AI 公司是否会引入”分时 token 定价”?这是一个值得关注的方向。

  4. 基础设施投资的长周期。 电力公司需要提前多年投资发电厂和输电网络。AI 公司需要提前锁定 GPU 供应和数据中心容量。两者都面临”需求不确定但投资必须提前”的资本配置难题。

竞争对手的连锁反应

Anthropic 的定价变革不会发生在真空中。它将对整个企业 AI 市场的定价策略产生连锁影响。

OpenAI 是最直接的参照对象。ChatGPT Enterprise 目前采用按席位定价模式,据多家媒体报道其企业版定价约为60美元/用户/月(来源: OpenAI 官网定价页面, ChatGPT Enterprise 采用”联系销售”模式,具体价格因合同而异)。Anthropic 的转型给 OpenAI 出了一道难题:如果跟进转向 usage-based,可能引发现有客户的不满和流失;如果坚持固定费率,可能面临与 Anthropic 同样的成本倒挂问题——特别是当 OpenAI 自己的 agent 产品(如 Codex、Operator)使用量增长时。Sam Altman 公开表达的”像电力一样计费”的愿景(来源: India Today, 2026-04-15),暗示 OpenAI 内部已经在为类似的转型做准备。

Google 的情况更为复杂。Google Cloud 本身就是 usage-based 定价的老手,Gemini 的 API 定价早已是按 token 计费(Gemini 1.5 Pro 的 input 定价为1.25美元/百万 token,来源: Google Cloud 定价页面)。但 Google Workspace 中集成的 AI 功能(如 Gemini in Docs/Sheets)目前以 Gemini Business(14美元/用户/月)和 Gemini Enterprise(36美元/用户/月)的固定附加费形式提供(来源: Google Workspace 定价页面)。当 AI agent 能力增强后,Google 是否会将 Workspace AI 从席位捆绑中拆分出来,单独按量计费?

Microsoft 面临类似的抉择。Microsoft 365 Copilot 的定价目前是30美元/用户/月的附加费模式(来源: Microsoft 365 定价页面)。但随着 Copilot 从”辅助建议”进化为”自主执行”,其 token 消耗模式将发生根本变化。Microsoft 是否会步 Anthropic 后尘?

《朝鲜日报》英文版的报道标题直接点明了这一趋势的行业性:”AI Industry Shifts to Pay-Per-Use Models Amid Rising Costs”(来源: Chosun, 2026-04-16)。这不是一家公司的定价调整,这是一个行业的商业模式转型。


第4章:反面论证——这可能是一步错棋吗?

大多数分析(包括本文前几章的论证)倾向于将 Anthropic 的 usage-based 转型视为”正确但痛苦”的选择。但一个严肃的分析必须考虑反面:这次调整可能在战略上是错误的。 以下是三个值得认真对待的反面论点。

反面论点1:竞争对手可能借机以固定费率抢客户

企业采购决策中,预算可预测性往往比绝对成本更重要。一位企业 CIO 在 Hacker News 的讨论中指出:”我宁愿每月确定花20万美元在 AI 上,也不愿面对一个可能是15万也可能是40万的月度账单。”(来源: Hacker News 讨论, 2026-04-16)

如果 OpenAI 选择在 Anthropic 转型期间坚持固定费率——甚至推出”无限量”套餐来吸引 Anthropic 的流失客户——它可能在短期内获得显著的市场份额增长。对于那些刚刚开始大规模部署 AI agent 的企业来说,”固定费率”意味着可以放心地让团队探索和试错,而不必担心每一次 agent 调用都在烧钱。Anthropic 可能因此失去正处于 AI 采用 S 曲线上升期的关键客户群。

反面论点2:Usage-based 模式可能扼杀开发者生态的网络效应

Claude Code 的竞争力不仅来自模型本身,还来自围绕它建立的开发者生态——插件、集成、工作流模板、社区知识。这个生态的健康依赖于大量开发者的活跃使用。

Usage-based 定价可能导致一种”冷启动困境”:开发者在探索阶段的 token 消耗是”浪费性”的(大量试错、实验、学习),但这种浪费恰恰是生态建设的必要投入。当每一次实验都有可见的成本,开发者可能减少探索性使用,转而只在”确定有价值”的场景下调用 Claude Code。这会减缓生态的扩展速度,削弱 Anthropic 的长期竞争壁垒。

GitHub Copilot 的成功很大程度上得益于其10美元/月的固定费率——开发者可以毫无心理负担地在任何场景下使用它,这种”无摩擦”的体验是其快速渗透的关键。Anthropic 的 usage-based 模式在这一点上是逆势而行。

反面论点3:企业采购流程的制度性障碍可能比预期更严重

许多大型企业的 IT 预算审批流程是年度制的,预算一旦确定就很难在年中调整。Usage-based 模式带来的支出不确定性与这种制度存在根本性冲突。一些企业可能不是”不愿意”采用 usage-based 模式,而是”制度上无法”采用——他们的财务系统、审批流程、合规要求都是围绕固定预算设计的。

Bessemer Venture Partners 在其2025年 Cloud Index 报告中指出,usage-based 定价的 SaaS 公司虽然在收入增长上表现更好,但其净收入留存率(NRR)的波动性也显著更高——在经济下行期,usage-based 公司的收入下降速度比订阅制公司快2-3倍(来源: Bessemer Venture Partners, State of the Cloud 2025)。这意味着 Anthropic 的收入在宏观经济波动面前将更加脆弱。

我的判断:正确的方向,但执行风险不可忽视

权衡以上反面论点后,我的判断是:Anthropic 的方向是正确的,但执行节奏和配套机制将决定成败。

方向正确的原因很简单:固定费率在 agent 时代的数学是不可持续的,这是一个结构性事实,不会因为竞争策略的考量而改变。OpenAI 即使短期内坚持固定费率来抢客户,最终也会面临同样的成本压力——除非它愿意持续亏损补贴。

但执行风险是真实的。Anthropic 需要在转型过程中提供足够的”缓冲机制”来缓解上述三个风险:比如为新客户提供前3个月的 token 消费上限保护、为开发者提供免费的探索性 token 额度、为大型企业提供年度承诺消费折扣(类似 AWS 的 Savings Plans)。如果 Anthropic 只是简单地”拔掉 bundled tokens”而不提供这些过渡机制,它可能在正确的战略方向上犯下战术性错误。


第5章:赢家与输家——谁在新定价模式下受益,谁在受伤?

赢家:轻度用户、大型企业、AI FinOps 赛道

轻度企业用户。 对于那些只是将 Claude 作为偶尔使用的智能助手的企业——每个用户每月进行几十次对话、写几份报告——新的20美元基础费加少量 token 费用的总成本,几乎可以确定低于此前的固定席位费。这降低了企业 AI 采用的入门门槛,可能吸引一批此前被高额月费吓退的中小企业。

具备精细化成本管理能力的大型企业。 拥有成熟 FinOps(Financial Operations)团队的大型企业,能够通过使用量监控、预算告警、用量优化等手段来管理 AI 支出。对他们来说,usage-based 模式提供了更大的成本优化空间——他们可以通过调整使用模式、选择合适的模型版本、优化 prompt 长度等方式来降低 token 消耗。

AI FinOps 赛道。 这可能是此次定价变革最大的间接受益者。当企业 AI 支出从固定预算变成动态消耗,企业对 AI 成本可见性、优化和治理的需求将急剧上升。类比云计算领域,AWS 的 usage-based 定价催生了 CloudHealth、Cloudability(后被 Apptio 收购,Apptio 又被 IBM 以约46亿美元收购)、Spot.io(后被 NetApp 收购)等一批云成本优化公司。企业 AI 的 usage-based 转型将催生一个类似的”AI FinOps”赛道。

这个赛道的市场规模潜力巨大。当每家企业都需要回答”我们的 AI agent 每天消耗多少 token?哪些团队的消耗效率最高?如何在不影响产出的前提下降低20%的 token 成本?”这些问题时,AI FinOps 工具将成为刚需。

输家:重度个人用户、早期 AI 创业公司、固定预算制企业

重度个人用户和小型开发团队。 那些深度依赖 Claude Code 进行日常开发工作的个人开发者和小型团队,是此次调整最直接的受害者。他们此前在固定费率下享受的”无限量”使用体验将不复存在。Gizmodo 报道中提到的用户抱怨(来源: Gizmodo, 2026-04-16)反映了这个群体的真实痛感。

固定 IT 预算制的企业。 许多传统企业的 IT 预算是年度固定的,预算审批流程冗长。Usage-based 模式带来的支出不确定性与这种预算体制存在根本性冲突。这些企业可能会因为无法预测 AI 支出而选择限制使用量,甚至推迟 AI 采用计划。

依赖 Claude API 的早期 AI 创业公司。 那些在 Claude API 之上构建产品的创业公司,其成本结构直接受到 Anthropic 定价变化的影响。如果他们的产品是按固定月费卖给终端用户的,而底层的 Claude API 成本变成了按量计费,他们将面临与 Anthropic 此前相同的”固定收入 vs. 可变成本”的结构性矛盾。这种成本传导效应可能迫使整个 AI 应用生态链重新思考定价策略。

一个被忽视的维度:Usage-Based 模式对 AI 采用行为的心理影响

大多数分析集中在经济层面——谁花更多钱、谁花更少钱。但有一个更深层的行为经济学效应值得关注:usage-based 定价会改变用户使用 AI 的心理模式。

在固定费率下,用户的心理是”我已经付了钱,不用白不用”。这鼓励了探索性使用——用户愿意尝试各种 prompt、让 AI 做各种实验性的任务,因为边际成本为零。这种探索性使用往往是企业发现 AI 新用例、培养 AI 使用习惯的关键路径。

在 usage-based 模式下,每次使用都有可见的成本。用户的心理会转变为”这次调用值不值这个 token 钱?”。这种”计量焦虑”(metering anxiety)可能抑制探索性使用,让用户倾向于只在”确定有价值”的场景下使用 AI。短期来看,这会降低无效消耗、提高使用效率;长期来看,这可能减缓企业内部 AI 使用场景的扩展速度。

这与云计算的历史经验一致。AWS 的 usage-based 定价在早期确实让一些开发者产生了”云焦虑”——害怕因为一个配置错误导致天价账单。直到预算告警、成本上限等保护机制成熟后,这种焦虑才逐渐缓解。Anthropic 和整个企业 AI 行业需要建设类似的”安全网”机制——比如月度支出上限、用量异常告警、分级计费阈值等——来缓解企业用户的计量焦虑。


第6章:大多数人没看到的——定价变革背后的战略博弈

洞察1:Anthropic 正在用定价筛选客户

表面上看,这次定价调整是一个成本管理决策。但从战略层面看,Anthropic 正在通过定价机制进行客户筛选。

Usage-based 定价天然地将客户群体分为两类:对 AI 价值高度确信的客户(愿意为实际使用量付费,因为他们清楚 AI 带来的回报远超成本)和对 AI 价值尚不确定的客户(在固定费率下愿意尝试,但面对按量计费时会犹豫)。

Anthropic 选择的是前者。这是一个深思熟虑的战略取舍:放弃一部分”试探性”客户,换取与”高确信度”客户建立更深度、更可持续的关系。这些高确信度客户恰恰是 AI agent 产品的核心用户群——他们会持续增加使用量,为 Anthropic 贡献持续增长的收入。

洞察2:这是 Anthropic 为 AI Agent 经济体系铺路

更深一层,这次定价调整可能是 Anthropic 为即将到来的”AI Agent 经济体系”做基础设施准备。

在一个 AI agent 自主执行任务的世界里,”用户”的概念本身正在被重新定义。当多个 agent 同时工作时,这算1个用户还是5个用户?当 Claude Code 在凌晨3点自主运行测试套件时,这个”用户”甚至不是人类。

按席位定价在这种场景下完全失效——你无法为一个 AI agent 分配一个”席位”。但按 token 计费可以完美地适配这种场景:无论是人类用户的交互还是 agent 的自主执行,所有计算消耗都统一计量为 token,统一计价。

这意味着 Anthropic 的定价变革不仅是在解决当前的成本问题,更是在为未来的 agent-to-agent 经济体系建立计量基础设施。当企业的 AI agent 可以自主调用其他 AI agent 的服务时,token 将成为这个经济体系中的”通用货币”。

洞察3:定价模式将成为比模型性能更重要的竞争维度

在企业 AI 市场的早期阶段,竞争的核心维度是模型性能——谁的模型更聪明、更准确、更快。但随着主流模型的性能差距逐渐缩小(Claude、GPT、Gemini 在大多数企业用例上的表现差异已经不大,据 LMSYS Chatbot Arena 2026年3月的排名,前五名模型在 ELO 评分上的差距已缩小至50分以内),定价模式正在成为新的核心竞争维度。

对于企业采购决策者来说,”Claude 在编码任务上比 GPT 好5%”可能不足以驱动供应商切换。但”Anthropic 的 usage-based 模式让我们的 AI 支出降低了30%”或”OpenAI 的固定费率让我们的预算更可预测”——这些定价层面的差异可能成为决定性因素。

这意味着 AI 公司的竞争将从”谁的模型最好”转向”谁的定价最适合我的使用模式”。未来的赢家可能是那些能够提供最灵活、最精细化定价选项的 AI 公司——就像 AWS 通过 On-Demand、Reserved、Spot 等多种定价机制来满足不同客户需求一样。

洞察4:这暴露了 AI 行业的一个根本性张力

Anthropic 的定价变革揭示了 AI 行业的一个根本性张力:模型能力越强、agent 越自主,计算成本越不可控。

这与传统软件行业的成本结构完全不同。传统 SaaS 产品的边际服务成本接近于零——多一个用户使用 Salesforce,Salesforce 的成本几乎不变。但 AI 产品的边际服务成本是实质性的——每一次 token 生成都需要 GPU 算力,每一个 agent 任务都在消耗真实的计算资源。

这意味着 AI 产品永远无法达到传统 SaaS 那样的毛利率水平(Salesforce 2025财年毛利率约为76%,来源: Salesforce 2025 10-K),除非:(a) 计算成本大幅下降(通过更高效的硬件或更高效的模型架构),或 (b) 定价模式准确地将成本传导给用户。

Anthropic 选择了 (b)。这是一个务实的选择,但它也意味着 AI 产品在用户眼中将更像”消耗品”而非”订阅服务”。这种感知上的转变可能深刻影响企业对 AI 的采购心态和使用行为。


结语:定价即战略——So What?

Anthropic 的定价变革不是一个孤立事件。它是企业 AI 行业从”软件许可证”逻辑向”公用事业”逻辑转型的标志性节点。

对于不同的读者,这意味着不同的行动:

如果你是企业 AI 采购决策者: 开始建设 AI 成本监控和优化能力。Usage-based 定价正在成为行业标准,你需要像管理云计算支出一样管理 AI 支出。建立 token 消耗的可见性、设置预算告警、评估每个用例的 ROI——这些将成为 AI 治理的基本功。

如果你是 AI 创业者: 重新审视你的定价策略。如果你在 Claude 或 GPT 的 API 之上构建产品,你的底层成本已经是 usage-based 的。将固定月费卖给终端用户意味着你在承担成本波动风险。考虑将 usage-based 成本透明地传导给用户,或者建立足够的定价缓冲来吸收波动。

如果你是投资者: 关注 AI FinOps 赛道。当企业 AI 支出从固定预算变成动态消耗,AI 成本优化工具将成为刚需。这是一个类比云计算 FinOps 赛道的投资机会,且时间窗口正在打开。

如果你是 AI 行业从业者: 认识到定价模式本身正在成为核心竞争力。在模型性能趋同的时代,谁能设计出最适合企业使用模式的定价方案,谁就能赢得市场。

最后一个判断:Anthropic 的这次调整在短期内会引发用户不满和部分客户流失。但从中长期看,这是一个方向正确的战略选择——前提是 Anthropic 能够在执行层面提供足够的过渡机制(消费上限、承诺折扣、探索性额度)来缓冲转型冲击。它让 Anthropic 的收入结构与成本结构对齐,为 agent 时代的计算经济体系奠定了基础,并迫使企业用户认真评估 AI 的真实价值。

固定费率时代已经结束。企业 AI 的”电力时代”已经开始。问题不是”是否”转向 usage-based,而是”何时”以及”如何”。Anthropic 给出了它的答案。OpenAI、Google、Microsoft 的答案,不会太远。


注:本文部分数据来自2026年4月中旬的媒体报道,Anthropic 的具体定价细节可能随产品迭代而调整。文中标注为”假设性估算”的数字仅用于说明结构性逻辑,不代表 Anthropic 的实际财务数据。

参考资料

  1. Anthropic ejects bundled tokens from enterprise seat deal — The Register, 2026-04-16
  2. Anthropic shifts enterprise billing to usage-based pricing — Implicator.ai, 2026-04-16
  3. Anthropic Is Jacking Up the Price for Power Users Amid Complaints Its Model Is Getting Worse — Gizmodo, 2026-04-16
  4. AI Industry Shifts to Pay-Per-Use Models Amid Rising Costs — The Chosun Daily, 2026-04-16
  5. Sam Altman said OpenAI would like to bill AI like electricity, Anthropic may already be testing it — India Today, 2026-04-15
  6. Anthropic shifts to usage-based billing, increasing costs for heavy users — Ainvest, 2026-04-16
  7. Bessemer Venture Partners, “State of the Cloud 2025” — 来源: Bessemer Venture Partners, 2025
  8. Gartner, “Forecast: Public Cloud Services, Worldwide, 2023-2028” — 来源: Gartner, 2025

主题分类:AI商业模式