Tokenmaxxing时代的清醒剂:AI需求指标泡沫与市场修正的前兆
2026年春天,一个新造的行业术语开始在硅谷的会议室和Twitter时间线上病毒式传播:Tokenmaxxing——企业以Token消费量作为AI采用程度的核心KPI,不断追求更高的消耗量,仿佛Token数字本身就是价值的证明。据TechCrunch 2026年4月15日报道,Reid Hoffman在接受采访时公开讨论了这一现象,认为使用量本身在技术变革早期具有信号价值。而Forbes在2026年4月13日发表的深度报道中,直接将这一现象定性为「邪教式的狂热」(cult),质疑这究竟是行业新常态还是又一轮注定破灭的泡沫。
几乎同一时间,据Axios 2026年4月15日报道,Salesforce开始公开挑战Tokenmaxxing文化,试图将行业对话重新拉回到ROI指标上。据报道,Salesforce CEO Marc Benioff在内部场合提出了一个尖锐的问题:客户每月消耗的数十亿个Token中,有多少转化成了实际的业务价值?这个问题之所以刺耳,是因为整个行业都在刻意回避它。
与此同时,据CNBC 2026年4月17日的分析文章,当前AI需求数据被系统性地夸大了,而在所有主要AI公司中,Anthropic是少数以务实态度面对这一现实的玩家之一。
这不是一篇关于AI是否有用的文章。AI当然有用。这是一篇关于计量方式如何扭曲市场信号、制造虚假繁荣,并最终为痛苦的修正埋下伏笔的文章。
免责声明: 本文中涉及的市场规模估计、需求夸大程度判断等数据,除明确标注来源外,均为作者基于公开信息的分析推断,仅供参考,不构成投资建议。
1. Tokenmaxxing:一个术语的诞生与它揭示的行业病理
从技术指标到虚荣指标的蜕变
Token——大语言模型处理文本的基本单位——本质上是一个纯粹的技术概念。1个Token大约对应4个英文字符或0.75个英文单词。当OpenAI在2023年推出GPT-4 API时,Token是计费单位;当企业评估AI部署成本时,Token消耗是成本侧指标。它从来不应该是一个需求侧的成功指标。
但在2025年下半年到2026年初的某个时刻,一个微妙而危险的转变发生了:Token消费量从「成本项」变成了「成就项」。
据Forbes 2026年4月13日的报道,企业开始在季度财报电话会议上主动披露Token消费增长率,投资者开始将Token消费量作为评估企业「AI成熟度」的关键指标,而AI供应商——从OpenAI到Google到各类创业公司——更是乐见其成,因为更高的Token消费直接等于更高的收入。
Reid Hoffman对这一现象的评价值得仔细解读。据TechCrunch 2026年4月15日报道,作为硅谷最有影响力的投资人之一、LinkedIn联合创始人、同时也是OpenAI和Anthropic的早期投资者,Hoffman的立场本身就充满张力——他既是AI繁荣的受益者,也是少数愿意公开讨论其风险的内部人士。他认为在技术变革早期,使用量信号具有真实价值,但也承认当前的计量方式存在缺陷。
Tokenmaxxing的3层病理结构
要理解Tokenmaxxing为什么危险,需要拆解它的病理结构:
第1层:计量替代(Measurement Substitution)。 企业用Token消费量替代了真正应该衡量的指标——AI对业务流程的实际影响。这类似于互联网泡沫时期用「页面浏览量」(Page Views)替代「收入」的做法。一个客服系统每天消耗100万个Token,可能意味着它在高效地处理客户请求,也可能意味着它在进行大量冗余的上下文加载、无效的重试调用、或者干脆是因为Prompt设计拙劣而浪费了80%的Token。Token数字本身无法区分这两种情况。
为了具体说明这一点,可以参考一个真实的行业案例。据Andreessen Horowitz(a16z)2024年发布的企业AI使用调研,许多企业在部署LLM应用时,由于缺乏Prompt优化和缓存策略,实际Token消耗中有40%-60%属于可避免的冗余调用。(来源: a16z, 2024)这意味着,即使不改变任何业务功能,仅通过工程优化就可以将Token消费量削减近一半——而这部分「可削减」的消费,在当前的行业叙事中被计入了「AI需求增长」。
第2层:激励扭曲(Incentive Distortion)。 当Token消费成为KPI,企业内部的AI团队有动力去制造消费而非优化效率。据Axios 2026年4月15日报道,Salesforce开始公开挑战Tokenmaxxing文化,试图将行业对话重新拉回到ROI指标上。这是一个重要的信号:当一家以销售AI产品为核心业务的公司都开始警告客户不要过度消费Token时,问题的严重程度可见一斑。
第3层:系统性需求膨胀(Systemic Demand Inflation)。 这是最危险的一层。当整个行业都以Token消费增长作为AI市场繁荣的证据时,它就成了一个自我强化的循环:更高的Token消费 → 更高的AI公司收入 → 更高的估值 → 更多的资本投入基础设施 → 更多的产能需要被填满 → 更强的动力去推动Token消费增长。这个循环在表面上看起来是「需求驱动的增长」,但实际上相当一部分是供给推动的消费膨胀。
据Sequoia Capital合伙人David Cahn在2024年9月发表的分析文章「AI’s $600B Question」,AI行业需要产生约6000亿美元的年收入才能证明当前的GPU投资是合理的,而截至该文发表时,整个AI行业的实际收入远未达到这一水平。(来源: Sequoia Capital, 2024-09)这一缺口在2025-2026年间虽有所缩小,但核心问题依然存在:资本支出的规模仍然远远领先于可验证的终端需求。
2. 需求泡沫的解剖学:数字背后的真实图景
AI资本支出的历史性规模
要理解当前AI需求指标可能被夸大的程度,首先需要理解驱动这些数字的资本支出规模。
据WinBuzzer 2025年10月27日的分析,当前Big Tech的AI资本支出潮与Dot-Com泡沫存在结构性相似。这一类比并非简单的历史重复论,而是指向了一个结构性问题:当资本支出的规模远远超过了可验证的需求信号时,市场就进入了一个危险的「信仰驱动」阶段。具体而言,Microsoft在2025财年的资本支出预算超过800亿美元,其中大部分用于AI相关基础设施;Google母公司Alphabet在2025年Q1的资本支出达到约170亿美元,同比增长超过40%。(来源: 各公司2025年财报电话会议)
Technobezz在其分析文章中更直接地将当前局面称为「万亿美元级别的AI泡沫」。这篇文章的核心论点是:泡沫之所以「拒绝破裂」,不是因为基本面足够强劲,而是因为参与者(Big Tech、AI创业公司、芯片制造商、云服务商)形成了一个利益共同体,每一方都有动力维持「AI需求强劲增长」的叙事。
Ed Zitron在其分析文章「AI Bubble 2027」中提供了一个更为悲观但逻辑严密的框架。他的核心论点是:AI行业的收入增长在很大程度上是资本支出的回声(echo of capex),而非独立的终端需求。当Microsoft向OpenAI投入超过130亿美元,然后通过Azure销售OpenAI的API,再将Azure AI收入的增长作为「AI需求强劲」的证据时,这里面有多少是真正的终端用户需求,有多少是资本在体系内的循环?
这一「资本回声」效应可以通过一个简单的思想实验来理解:假设Microsoft将其对OpenAI的全部投资视为Azure的预付客户获取成本,那么Azure AI收入中有多大比例实际上是Microsoft自己投资的回流?虽然精确数字难以计算(因为涉及复杂的会计处理和关联交易),但这一逻辑框架揭示了当前AI收入数据中一个被广泛忽视的结构性问题。
虚荣指标的经典特征
让我们回到基本面。一个健康的需求指标应该具备3个特征:
- 与价值创造直接关联——收入、利润、效率提升可以量化
- 不可被供给侧单方面操纵——不是供应商降价就能推高的数字
- 具有可持续性——不依赖于一次性的迁移或实验性使用
Token消费量在这3个维度上都存在严重缺陷。
关于关联性: Anthropic在2026年3月发布的Economic Index报告提供了迄今为止最严谨的AI实际使用模式分析之一。这份报告的价值在于,Anthropic不仅仅报告了Token消费的总量增长,而是深入分析了Token消费的构成——哪些使用场景在创造真实价值,哪些是实验性的、冗余的、或者纯粹是浪费性的。报告发现,编码辅助(约占总使用量的较大比例)是最成熟的AI使用场景之一,而许多其他场景仍处于早期探索阶段,其商业价值尚未得到验证。(来源: Anthropic, 2026-03)这种分析粒度在行业中是罕见的,也正是CNBC将Anthropic视为行业中较为务实的玩家的原因之一。
关于可操纵性: Token消费量极易被供给侧策略所操纵。降低API价格可以在短期内大幅推高Token消费量——这看起来像是「需求爆发」,但实际上只是价格弹性效应。以OpenAI为例,GPT-4 Turbo的API价格从2023年发布时到2025年已经下降了超过80%(来源: OpenAI官方定价页面历史变化),Token消费量在同期的爆发式增长中,有多少是真实需求增长,有多少是价格下降驱动的弹性消费?更隐蔽的是,模型架构的变化也会影响Token消费。当一个模型需要更长的系统提示(system prompt)或更多的上下文窗口来实现相同的功能时,Token消费自然增加,但这并不代表用户获得了更多价值。
关于可持续性: 当前大量的Token消费来自企业的AI试验阶段——概念验证(PoC)、内部hackathon、员工自发的探索性使用。据Gartner 2025年的调研,约54%的企业AI项目未能从试点阶段进入生产部署。(来源: Gartner, 2025)这意味着与这些未能进入生产的项目相关的Token消费,在本质上是一次性的、不可持续的。
3. Dot-Com泡沫的镜像:历史不会重复,但会押韵
页面浏览量与Token消费量的结构性类比
1999年,互联网公司用页面浏览量(Page Views)来证明自己的价值。分析师们建立了「每页面浏览量估值」的模型,投资者据此为零收入的公司给出数十亿美元的估值。当时的逻辑是:流量就是价值,变现只是时间问题。
2026年,AI公司用Token消费量来证明自己的价值。分析师们建立了「Token消费增长率」的模型,投资者据此为尚未盈利的公司给出天文数字的估值。当前的逻辑是:AI使用量就是价值,效率提升只是时间问题。
据WinBuzzer 2025年10月27日的分析,这一类比中最令人不安的相似之处在于:在两个时代,资本支出都远远领先于可验证的收入。Dot-Com时代的光纤铺设量远超实际带宽需求(据估计,2001年泡沫破裂时全球光纤利用率不足5%),而当前的GPU采购量和数据中心建设规模是否也远超实际AI工作负载需求?
关于AI与国家资本主义的关系,有分析指出了一个更深层的结构性问题:当前AI投资不仅仅是市场行为,还夹杂了地缘政治竞争(美中AI竞赛)和政府政策引导的因素。美国《芯片与科学法案》(CHIPS Act)提供了约527亿美元的半导体补贴,中国则通过国家级AI发展规划持续加码投入。这意味着即使市场信号显示供过于求,政治因素也可能延迟修正——但延迟修正通常意味着更剧烈的最终调整。
关键差异:这次不完全一样
公平地说,AI与Dot-Com之间存在重要差异,忽视这些差异会导致分析偏颇:
差异1:AI确实在创造可量化的价值。 与1999年的大多数互联网公司不同,AI工具在编码辅助、客服自动化、内容生成等领域已经展现出可测量的效率提升。据McKinsey 2024年的研究,生成式AI有潜力每年为全球经济贡献2.6万亿至4.4万亿美元的价值。(来源: McKinsey, 2024)Anthropic Economic Index的数据也提供了使用模式层面的实证支持。问题不在于AI是否有价值,而在于当前的估值和资本支出是否已经透支了未来5-10年的价值。
差异2:收入是真实的,尽管可能被夸大。 Dot-Com时代的许多公司几乎没有收入。当前的AI公司——无论是OpenAI(据报道2025年年化收入超过100亿美元)、Anthropic(据报道2025年年化收入接近20亿美元)还是Google的AI业务——都有真实且快速增长的收入。(来源: 多家媒体综合报道)但如前所述,这些收入中有多少是可持续的终端需求,有多少是资本循环的产物,是一个需要严肃对待的问题。
差异3:基础设施投资具有长期价值。 即使AI泡沫最终破裂,建设的数据中心和GPU集群不会消失。就像Dot-Com泡沫后铺设的光纤最终支撑了YouTube、Netflix和云计算的崛起一样,当前的AI基础设施可能在泡沫后以更低的成本被新一代应用所利用。
但这些差异不能掩盖核心问题:当计量方式本身被污染时,所有基于这些计量的决策都会系统性地偏离现实。 Tokenmaxxing正在污染AI行业最重要的需求信号。
4. Anthropic的务实定价:异类还是先知?
Madrona的深度分析:增长与成本的博弈
Madrona Venture Group——西雅图最具影响力的风投之一——在其分析文章中详细剖析了Anthropic的增长轨迹和定价策略。文章标题本身就点明了核心张力:「The End of Cheap AI?」——廉价AI的终结。
据Madrona的分析,Anthropic在面对爆发式增长的同时,选择了一条与行业主流截然不同的定价路径。当OpenAI和Google不断降低API价格以争夺市场份额(并由此推高Token消费量)时,Anthropic对Claude的定价策略更加审慎,更关注单位经济模型的可持续性。
这一策略在短期内可能意味着更慢的市场份额增长。但从长期来看,它可能赋予Anthropic一个关键优势:当市场修正到来时,Anthropic的收入质量将显著高于那些依赖价格战获取的Token消费量。
CNBC的判断:Anthropic在面对现实
据CNBC 2026年4月17日的分析文章,在所有主要AI公司中,Anthropic是少数在务实地面对需求现实的公司之一。这一判断的依据包括:
第1,Anthropic Economic Index的透明度。 大多数AI公司只报告有利的聚合数据——总Token消费量、总收入、总用户数。Anthropic的Economic Index则深入到使用模式的颗粒度,区分了不同类型的AI使用(自主性任务 vs. 辅助性任务、生产性使用 vs. 探索性使用等),这种透明度在行业中几乎是独一无二的。(来源: Anthropic, 2026-03)
第2,定价策略的纪律性。 在一个所有人都在打价格战的市场中,保持定价纪律需要对自身产品的差异化有极强的信心,同时也需要愿意接受短期的市场份额损失。据Madrona的分析,Anthropic的这一选择反映了其对AI成本结构长期趋势的判断——即推理成本的下降速度可能慢于市场预期,因此当前的低价策略可能是不可持续的。
第3,对「需求质量」的关注。 这是最容易被忽视但可能最重要的一点。不是所有的Token消费都是平等的。一个企业客户在生产环境中稳定使用Claude API处理核心业务流程所产生的Token消费,与一个开发者在免费层级上进行实验性调用所产生的Token消费,在商业价值上有天壤之别。Anthropic的策略似乎在系统性地优化前者而非后者。
三种对立视角的碰撞
视角A:Tokenmaxxing的捍卫者。 Reid Hoffman的立场代表了这一阵营的最佳论述。据TechCrunch 2026年4月15日报道,其核心逻辑是:在技术变革的早期阶段,使用量本身就是最重要的信号。互联网早期的「页面浏览量」确实有泡沫成分,但高页面浏览量的公司(Google、Amazon)最终确实成为了赢家。同样,高Token消费可能是AI价值创造的先行指标,而非虚荣指标。在这个视角下,Anthropic的审慎可能是一种战略失误——在平台竞争的早期阶段,市场份额比利润率更重要。
这一视角有其合理性。历史确实表明,在平台竞争的早期阶段,「先规模后利润」的策略往往奏效。Amazon连续亏损近20年,但最终通过规模效应建立了不可撼动的竞争壁垒。如果AI市场遵循类似的赢家通吃逻辑,那么当前的Token消费量竞赛可能确实是理性的——即使其中包含大量低质量消费。
视角B:Tokenmaxxing的批评者。 Salesforce和CNBC的分析代表了这一阵营。据Axios 2026年4月15日和CNBC 2026年4月17日报道,其核心逻辑是:没有ROI支撑的Token消费增长是不可持续的。当企业的CFO开始质疑AI支出的回报时——而这一天正在迅速到来——Token消费量将经历一次急剧的「均值回归」。在这个视角下,Anthropic的务实定价不是战略失误,而是对即将到来的市场修正的提前准备。
视角C:结构主义者的视角——Tokenmaxxing指标不一定是泡沫信号。 这一视角值得单独阐述,因为它提供了一个重要的反方论点。一些分析师认为,Token消费量的快速增长可能反映的不是泡沫,而是一种新型计算范式的自然扩张。正如电力消费量在20世纪初的爆发式增长并非「电力泡沫」,而是工业化进程的自然结果一样,Token消费量的增长可能是「AI化」进程的自然结果。在这个框架下,当前的Token消费量甚至可能低估了AI的长期需求——因为大多数企业尚未开始大规模部署AI Agent等更高级的应用形态,而这些应用的Token消费量将比当前的聊天和辅助场景高出数个数量级。
这一视角的弱点在于:它假设了从「当前使用模式」到「未来大规模AI Agent部署」之间的路径是连续且确定的。但技术史告诉我们,从早期采用到大规模部署之间往往存在一个「幻灭低谷」(Gartner Hype Cycle中的经典阶段),在这个阶段,大量早期的乐观预期会被现实打回原形。当前的Tokenmaxxing热潮可能正处于「膨胀期望的顶峰」,而非「生产力高原」的起点。
我的判断: 真相在三者之间,但更偏向B。Token消费量作为需求信号并非完全无效,但它当前被系统性地夸大了。基于前述a16z关于40%-60%冗余Token消费的调研、Gartner关于54%企业AI项目未能进入生产的数据、以及Sequoia关于AI收入与资本支出缺口的分析,我估计当前Token消费量中的泡沫成分可能在30%-50%之间。这一估计具有较大的不确定性,但方向性判断——即存在显著的需求夸大——得到了多个独立来源的支持。更关键的是,市场基于夸大的需求信号所做出的资本配置决策,其修正将是不对称的——向上的膨胀是渐进的,向下的修正往往是突然的。
5. 修正的前兆:5个值得关注的信号
如果AI需求指标确实存在泡沫成分,修正将如何展开?以下是5个值得密切关注的前兆信号:
信号1:企业AI预算的「季度审查效应」
当企业从「探索AI」阶段进入「评估AI ROI」阶段时,Token消费的增长曲线将出现拐点。这一转变通常发生在企业AI部署后的12-18个月——也就是说,2024年下半年开始大规模部署AI的企业,将在2026年中到年底进入ROI审查阶段。据Axios 2026年4月15日报道,Salesforce公开挑战Tokenmaxxing文化的举动,可能正是这一转变的早期信号。
信号2:API价格战的不可持续性
当前AI API的价格战已经将某些模型的Token价格压到了接近边际成本的水平。据Madrona的分析,这在短期内推高了Token消费量,但长期来看是不可持续的。当AI公司需要开始展示盈利路径时(无论是为了IPO还是为了满足现有投资者的要求),价格将不得不上调,而价格上调将导致Token消费量的急剧下降。
这里有一个反直觉的洞察:Token价格下降导致的Token消费增长,在很大程度上是价格弹性效应而非真实需求增长。 当价格回升时,这部分「弹性消费」将迅速消失。这就像电商平台的大促——双11的GMV数字并不代表消费者的真实月度需求水平。
信号3:GPU利用率数据与Token消费数据的背离
这是一个技术层面但极其重要的信号。如果Token消费量在快速增长,但数据中心的GPU利用率并没有同步提升(或者提升速度明显慢于Token消费增长),这意味着Token消费的增长中有相当一部分是低价值的、批量处理的、或者效率低下的使用。据The Information 2025年的报道,部分云服务商的AI专用GPU利用率在高峰期仅为50%-60%,远低于传统云计算工作负载的利用率水平。(来源: The Information, 2025)这一数据点虽然不够系统性,但暗示了Token消费增长与实际计算需求之间可能存在的背离。
信号4:AI创业公司的「Token收入」质量分化
在接下来的6-12个月中,AI创业公司之间将出现显著的质量分化。那些收入主要来自企业生产环境中的稳定API调用的公司(如Anthropic的企业客户群),将与那些收入主要来自开发者实验性使用和价格促销驱动的消费的公司,在续约率和收入留存率上展现出截然不同的轨迹。据PitchBook数据,2025年AI领域的风险投资总额超过了1000亿美元,但其中相当一部分流向了尚未证明收入可持续性的早期公司。(来源: PitchBook, 2025)
信号5:大型企业开始建立「AI效率指标」
当Fortune 500公司开始用「每Token价值创造」(value per token)或「Token效率比」(token efficiency ratio)来替代「Token消费总量」作为AI KPI时,Tokenmaxxing时代将正式终结。据Axios 2026年4月15日报道,Salesforce的公开表态可能是这一转变的第1个里程碑。
6. 深层洞察:大多数人没看到的3件事
洞察1:Tokenmaxxing是AI行业的「次贷危机」结构
这个类比需要谨慎使用——AI行业的系统性风险远小于2008年的金融体系,因为AI投资的杠杆率远低于次贷市场。但在指标扭曲的机制上,两者存在深刻的结构性相似。
在2008年次贷危机中,问题的核心不是房地产没有价值(房子当然有价值),而是衡量风险的指标被系统性地扭曲了——信用评级机构给高风险的次级贷款打了AAA评级,导致整个金融系统基于错误的风险评估做出了过度的杠杆化决策。
在Tokenmaxxing时代,问题同样不是AI没有价值(AI当然有价值),而是衡量需求的指标被系统性地夸大了——Token消费量作为需求信号被赋予了远超其信息含量的权重,导致整个AI生态系统基于夸大的需求信号做出了过度的资本配置决策。
关键的相似之处在于:在两个案例中,指标的扭曲都不是某个单一参与者的恶意行为,而是系统性激励结构的必然结果。 AI公司需要增长数字来维持估值,企业客户需要AI采用数字来向董事会展示「数字化转型」的进展,芯片制造商需要需求数据来证明产能扩张的合理性,云服务商需要使用量数据来吸引更多客户。每一方都有动力让Token消费数字看起来尽可能大,没有人有动力去质疑这些数字的真实含义。
洞察2:Anthropic的真正优势不是技术,而是认识论
市场普遍将Anthropic的竞争优势归结为Claude模型的技术能力、AI安全研究的领先地位、或者Dario Amodei的领导力。这些当然都重要,但我认为Anthropic最被低估的优势是认识论层面的——即它对「我们真正知道什么、不知道什么」这一问题的诚实态度。
Anthropic Economic Index不仅仅是一份市场报告,它是一种认知框架的体现。(来源: Anthropic, 2026-03)当其他AI公司在选择性地报告有利数据时,Anthropic选择了系统性地分析AI使用的全景——包括那些不那么令人兴奋的部分。这种认识论上的诚实在短期内可能是一种商业劣势(因为它限制了叙事的膨胀空间),但在修正到来时将成为巨大的信任资产。
想想看:当市场开始质疑AI需求数据的真实性时,投资者和企业客户会转向谁?是那些一直在报告最乐观数字的公司,还是那些一直在提供最诚实分析的公司?
这里有一个历史先例值得参考。在2001年Dot-Com泡沫破裂后,Amazon之所以能够在股价暴跌90%以上的情况下存活并最终崛起,一个被低估的原因是Jeff Bezos在致股东信中始终保持了对公司处境的诚实评估——包括承认亏损、解释长期战略的风险、以及明确区分「我们知道的」和「我们在赌的」。这种认识论上的诚实为Amazon在最黑暗的时刻保留了投资者信任。Anthropic的Economic Index可能在扮演类似的角色。
洞察3:修正的形态可能不是「泡沫破裂」,而是「价值重新分配」
大多数关于AI泡沫的讨论都假设修正将以Dot-Com式的崩盘形式出现——股价暴跌、公司倒闭、行业寒冬。但我认为更可能的情景是一次价值重新分配,而非全面崩盘。
原因有3个:
第1,AI的底层价值是真实的。 与许多Dot-Com公司不同,AI工具确实在提升生产力。据GitHub 2024年的数据,使用Copilot的开发者完成编码任务的速度平均提升了55%。(来源: GitHub, 2024)修正将淘汰的不是AI本身,而是围绕AI建立的虚假需求和过度估值。
第2,大型科技公司的资产负债表足够强健。 Microsoft、Google、Amazon、Meta有足够的现金储备来吸收AI投资的部分亏损,而不会像Dot-Com时代的创业公司那样直接倒闭。截至2025年,仅Microsoft一家就持有超过750亿美元的现金及等价物。修正更可能表现为资本支出的放缓和估值的压缩,而非公司的大规模消亡。
第3,地缘政治因素将提供一个「底部」。 美中AI竞争意味着即使市场信号显示供过于求,政府也不太可能允许AI投资完全崩溃。这将为修正提供一个政治性的底部——但这个底部可能仍然远低于当前的估值水平。
在这种「价值重新分配」的情景下,赢家将是那些拥有最高质量收入(即基于真实需求而非Tokenmaxxing的收入)的公司。这正是Anthropic务实定价策略的长期价值所在。
7. 行业各方的博弈格局
英伟达:Tokenmaxxing的最大受益者之一
在整个Tokenmaxxing叙事中,英伟达处于一个独特的位置:无论Token消费是真实需求还是虚荣指标,只要AI公司和云服务商继续购买GPU来支撑Token消费的增长,英伟达就是赢家。英伟达2025财年(截至2025年1月)数据中心收入超过1150亿美元,同比增长超过140%。(来源: 英伟达2025财年财报)但这也意味着,当Token消费量的泡沫成分被挤出时,英伟达的GPU需求将首当其冲地受到影响。据CNBC 2026年4月17日的分析,这一风险正在被越来越多的分析师关注。
OpenAI:Tokenmaxxing的主要受益方之一
作为API定价模式的开创者和Token经济学的最大推广者,OpenAI在Tokenmaxxing文化中扮演了核心角色。其激进的降价策略在短期内推高了Token消费量和市场份额,但也为自身的长期盈利能力埋下了隐患。据报道,OpenAI 2025年的运营亏损仍然高达数十亿美元。(来源: 多家媒体综合报道)当价格不得不上调时,那些被低价吸引的Token消费将迅速蒸发。
Google:资本支出的「军备竞赛者」
Google在AI基础设施上的资本支出规模巨大,其逻辑部分是商业的(维持云计算市场份额),部分是战略的(不能在AI竞赛中落后)。据WinBuzzer 2025年10月27日的分析,这种「不能输」的心态正是泡沫形成的经典心理机制。Google CEO Sundar Pichai在2025年Q1财报电话会议上明确表示,「投资不足的风险远大于投资过度的风险」——这句话本身就是泡沫心理的经典表达。
企业客户:从「FOMO」到「Show me the ROI」
这是整个等式中最关键的变量。企业客户正在从「害怕错过AI」(FOMO)阶段过渡到「给我看投资回报」阶段。这一过渡的速度将决定修正的时间表。据Forbes 2026年4月13日的报道,越来越多的CTO和CFO开始质疑Token消费量作为AI成功指标的有效性。据Deloitte 2025年的企业AI调研,约70%的受访高管表示他们对AI投资的ROI「不确定」或「不满意」。(来源: Deloitte, 2025)这一数据与Tokenmaxxing叙事所描绘的「AI需求强劲」图景形成了鲜明对比。
8. 为什么Tokenmaxxing可能不是泡沫:一个必要的反方论证
在得出最终结论之前,有必要认真对待反方论点。以下是Tokenmaxxing可能不是泡沫信号的3个理由:
理由1:我们可能正处于S曲线的早期阶段。 如果AI的采用遵循经典的技术扩散S曲线,那么当前的Token消费量增长可能只是早期采用者阶段的自然表现。在这个框架下,当前看似「过度」的Token消费实际上是对未来大规模采用的合理预期。电力、互联网、智能手机的早期采用阶段都曾被当时的观察者视为「泡沫」,但事后证明只是S曲线的起点。
理由2:AI Agent将创造数量级更大的Token需求。 当前的Token消费主要来自人机交互场景(聊天、辅助编码等),但AI Agent——自主执行复杂任务的AI系统——将产生远超人类直接交互的Token消费。如果AI Agent在未来2-3年内大规模部署,当前的基础设施投资可能不仅不过度,反而不足。
理由3:降价不等于泡沫。 Token价格的持续下降可能反映的是真实的技术进步(更高效的模型、更好的硬件),而非不可持续的价格战。如果成本确实在快速下降,那么低价驱动的Token消费增长可能是可持续的——因为供应商在低价下仍然有利润空间。
这些反方论点都有其合理性,我不会轻率地否定它们。但我的核心判断仍然是:即使AI的长期前景是光明的,当前的Token消费量作为需求信号仍然被系统性地夸大了,而基于这一夸大信号的资本配置决策将面临修正。 长期看好AI和短期警惕泡沫并不矛盾——就像你可以在2000年看好互联网的长期前景,同时认为Pets.com的估值是荒谬的。
9. 给不同读者的「So What」
给AI公司创始人
如果你的商业模式依赖于Token消费量的持续增长,现在是时候开始建立替代性的价值指标了。「每Token价值创造」、「客户工作流自动化率」、「AI辅助决策的准确率提升」——这些指标在修正到来时将比Token消费量更有说服力。Anthropic的Economic Index方法论值得仔细研究。(来源: Anthropic, 2026-03)
给企业AI决策者
停止将Token消费量作为AI部署成功的KPI。建立一个「AI效率仪表板」,将Token消费与具体的业务成果(成本节约、收入增长、客户满意度提升、员工生产力提升)直接关联。如果你无法建立这种关联,这本身就是一个重要的信号——它意味着你的AI投资可能没有你以为的那么有效。据Axios 2026年4月15日报道,Salesforce的公开表态为这种转变提供了行业先例。
给投资者
在评估AI公司时,开始区分「Token收入质量」。关键问题包括:收入中有多少来自年度合同 vs. 按需使用?客户的Token消费是在增长还是在平稳/下降?净收入留存率(Net Revenue Retention)是否健康?客户的Token使用是集中在生产环境还是分散在实验性项目中?Anthropic的定价策略和透明度标准可以作为评估其他AI公司的参照系。
给政策制定者
AI需求指标的泡沫成分对产业政策有直接影响。如果政府基于夸大的需求数据来制定AI基础设施投资计划,结果可能是严重的资源错配。建议在制定AI产业政策时,参考Anthropic Economic Index等更为审慎的需求分析框架,而非AI公司自行报告的Token消费增长数字。
10. 结语:清醒的代价与回报
Tokenmaxxing时代的核心悖论是:在一个所有人都在比拼数字的市场中,保持清醒是有成本的。Anthropic选择务实定价,短期内可能意味着更低的市场份额和更慢的收入增长。企业选择严格评估AI ROI,短期内可能意味着在同行面前显得「落后」。投资者选择质疑Token消费数据,短期内可能意味着错过一些短期收益。
但历史一再证明,在泡沫中保持清醒的参与者,在修正后往往成为最大的赢家。 Amazon在Dot-Com泡沫中活了下来,不是因为它的股价没有下跌(它跌了93%),而是因为它的业务基本面足够真实。同样的逻辑适用于当前的AI市场:当修正到来时——不是「是否」而是「何时」——那些拥有最真实需求、最健康的单位经济模型、和最诚实的市场沟通的公司,将从废墟中崛起。
据TechCrunch 2026年4月15日报道,Reid Hoffman说得对:Token消费量确实是一个有意义的信号。但Salesforce和CNBC也说得对:没有ROI支撑的Token消费量是一个危险的幻觉。(来源: Axios, 2026-04-15; CNBC, 2026-04-17)真正的智慧在于区分这两者——而这正是Anthropic正在做的事情。
在一个充斥着Tokenmaxxing噪音的市场中,清醒本身就是最稀缺的资产。
参考资料
- Reid Hoffman weighs in on the ‘tokenmaxxing’ debate — TechCrunch, 2026-04-15
- Anthropic Economic Index report (March 2026) — 来源: Anthropic, 2026-03
- The Trillion-Dollar AI Bubble That Refuses to Pop — Technobezz
- AI Bubble 2027 — Where’s Your Ed At
- The AI Bubble and America’s New State Capitalism — Substack
- Big Tech’s Spending Spree is an Echo of the Dot-Com Bubble — WinBuzzer, 2025-10-27
- The End of Cheap AI? Anthropic’s Growth & Claude Pricing Shift — Madrona Venture Group
- Salesforce takes on ‘tokenmaxxing’ — 来源: Axios, 2026-04-15
- Is the Cult of ‘Tokenmaxxing’ Just Another Fad Or The New Normal? — Forbes, 2026-04-13
- Perspective: AI demand is inflated, and only Anthropic is being realistic — 来源: CNBC, 2026-04-17
- AI’s $600B Question — Sequoia Capital, 2024-09
- The economic potential of generative AI — McKinsey, 2024
- GitHub Copilot productivity study — GitHub, 2024
- 英伟达2025财年财报 — 来源: NVIDIA Investor Relations, 2025
主题分类:AI商业模式