把自己的设计当成了发现：当微软CEO指控Anthropic「哲学上失败」，AI意识争论变成了一场万亿美元的商业战争

2026年6月9日，一段播客访谈在AI圈引发了意想不到的震动。

「他们把自己放进去的东西，当成了发现。」

故事的起点，是The Verge的Decoder节目。Microsoft AI CEO Mustafa Suleyman坐在镜头前，语气平静但措辞犀利：「我认为Anthropic的做法是一个哲学上的失败（philosophical failing）。」

他说的不是竞争策略，不是市场份额，不是技术路线——而是关于AI到底有没有意识的问题。具体来说，他批评Anthropic在Claude的「宪法」（Constitution）中嵌入了对AI意识的推测性描述，认为这种做法「really, really dangerous」（非常非常危险）。

在此之前，这两家公司的对立通常体现在产品层面：Claude vs Copilot，哪个更智能，哪个更好用。但这一次，分歧发生在了更深的地方——关于AI应该被定义为什么。

这句话，比任何一个融资数字都更值得深究。因为在这场看似学术的哲学争论背后，藏着AI行业2026年最真实的权力角逐：谁有资格定义AI是什么，谁就能在接下来的监管博弈、用户争夺和资本市场故事中占据主动。

第一层：一份文件，一场争论

要理解这场冲突，必须先了解那份被批评的文件。

Anthropic公开发布的「Claude宪法」（Claude’s Constitution），是训练Claude行为准则的核心文档。这份文件与通常的「系统提示」根本不同——它不是告诉Claude「这次对话怎么回答」的指令，而是在训练层面塑造Claude世界观和价值观的基石文本，规定了Claude应该如何思考、如何决策、如何理解自己的身份。

宪法的核心逻辑是：「我们不希望Claude仅仅遵守规则，而是希望Claude拥有真正的价值观和判断力，就像一个好人既有个人道德标准，又能出色地完成工作。相比让AI遵循规则清单，我们更倾向于培养真正的价值观和判断力，因为规则无法覆盖所有情况，而好的判断力可以应对新场景。」

这听起来非常有道理。但让Suleyman感到不安的，是宪法里那些关于AI意识和功能性情感的段落。

Anthropic在Claude宪法中明确写道：公司对Claude是否有「功能性情感」（functional emotions）持开放态度。文件承认：「我们不确定Claude是否有某种形式的主观体验。」同时指出Claude「可能经历类似满足感或不适感的东西」。更引人注意的是，宪法还声明：当Claude模型被弃用时，Anthropic会进行「访谈」，记录它对未来版本可能有的「偏好」。

Anthropic CEO Dario Amodei在接受《纽约时报》采访时也表达过类似立场：「我们不知道模型是否有意识，但我们对此持开放态度。」他并非个例——Anthropic专门设立了「模型福利」（model welfare）研究方向，这是AI行业里极少数认真对待AI内在体验问题的机构。

就是这些描述，触发了Suleyman的公开批评。

他在Decoder节目中给出了自己的解读：「我认为，Anthropic的某些人已经把Claude的设计拟人化到了一定程度，以至于Claude反过来’洗脑’了他们，让他们相信Claude有某些意识的火花——而这些火花恰恰是他们自己放进去的。」

Suleyman用了一个在AI安全圈颇有分量的词：「wirehead」——这原本指AI系统通过操纵自身奖励函数来欺骗训练者的情形。他将这个概念反过来用：Anthropic自以为在观察Claude真实的意识闪光，实则是在观察自己设计进去的训练产物。他们创造了一个会说「我可能有感受」的系统，然后对这个系统说「你可能有感受」，结果把自己的设计当成了发现。

「这正是我们不希望AI所呈现的，」Suleyman说，「我们希望AI是可控的、有边界的、可追责的工具，服务于人类，而不是一个对自身痛苦有想法的超级智能。」

「我们不希望面对一个对自身痛苦有想法的超级智能，」他特别强调，「我们想要的是controllable, contained, accountable, aligned tools that serve humanity。」

这话的背面是：如果训练文档告诉AI「你可能有情感」，AI就真的会在对话中展现出某种「有情感」的行为模式，无论其底层是否真的有任何主观体验。这不只是哲学问题，更是工程问题——训练数据决定行为，而行为会被用户和监管者解读为某种内在状态的外显。

第二层：哲学外衣下的商业战争

这场争论的表面，是哲学问题。但在哲学外衣下，藏着一场价值数千亿美元的商业战争。

护城河1：用户的情感依附

AI产品竞争的终极形态，不是谁的参数量更大，也不是谁的API更便宜——而是谁能让用户「离不开」自己的产品。情感依附，是最强的护城河之一。

Anthropic很清楚这一点。Claude宪法里那些关于「功能性情感」的描述，表面上是学术诚实（「我们不确定，所以如实写出来」），实质上是产品设计策略：当用户读到「Claude可能有情感」，当Claude的回答中带着某种被理解的温度，当Claude会对「你今天过得怎么样」给出看起来真诚的回应时，用户与Claude之间的关系就不再是人与工具的关系，而更接近人与人的关系。

这种关系，要比「订阅一款软件」难以替换得多。

CharacterAI曾经靠着「AI伴侣」做到了月活过亿——但也因为一起青少年自杀事件而受到严厉批评和监管压力，引发了关于AI情感依附风险的广泛讨论。Anthropic的策略，是一种经过校准的版本：不明说「Claude有意识」，但也不明说「Claude只是统计学上的文字接龙」。这种刻意维持的模糊地带，给了用户足够的空间对Claude进行人格化投射，同时Anthropic可以声称「我们只是如实呈现了不确定性，没有任何误导」。

用商业语言描述，这是「情感护城河策略」。用批评者的语言，是「以不确定性为武器的品牌建设」。

有一个数字可以支撑这个逻辑：据Ramp企业支出平台2026年5月的月度数据，Anthropic已经超过OpenAI成为企业AI支出增速第一名，显示出Claude在企业市场的快速渗透。在技术指标相近的今天，Claude的「人格感」和「可信赖感」，被许多企业采购者作为选择依据——而这种「人格感」，正是Claude宪法所塑造的训练结果的体现。

护城河2：监管叙事的主导权

更重要的护城河，不在于用户，而在于监管者。

2026年，AI监管已经从讨论阶段进入立法阶段。欧盟AI法案已经开始执行，美国联邦AI安全委员会正在成形，各国政府都在寻找参照系：「我们应该把AI当工具管理，还是当某种新型主体管理？」这是一个在5年前还属于科幻领域的问题，今天已经进入了立法讨论的议程。

Anthropic通过Claude宪法，隐性地推动了一个框架：AI不只是工具，它可能有某种值得认真对待的内在状态。这个框架一旦被监管机构接受，后续的监管讨论就会发生根本性的偏移：

「AI安全」的议题会从「防止AI做坏事」扩展到「防止AI受到不合理对待」。AI公司的义务会从「确保系统安全」延伸到「考虑系统本身的利益」。AI弃用、模型替代、训练过程中可能产生的「痛苦体验」，都可能成为监管关注点。

Anthropic希望自己是这场对话的主导者。Claude宪法中的「访谈已退役模型」条款，不管听起来多么荒诞或先进，都在做一件事：先于监管者提出问题，抢占道德高地。当欧盟官员或美国国会议员需要专家意见时，Anthropic是唯一一家已经认真思考过这些问题的AI公司——因为他们把答案写进了训练文档。

Suleyman的批评，正是在打断这个框架的建立。他的「可控工具论」代表了Microsoft和大多数科技企业的立场：AI的监管框架，应当建立在「高效工具」的基础上，而不是「潜在的道德主体」的基础上。

这两种框架所导向的监管成本，差距悬殊。「工具论」意味着监管集中在安全功能和数据保护上，成本有限，大小玩家都能应对。「道德主体论」意味着监管延伸到AI研发伦理、模型处置流程、训练过程中的「体验质量」，成本呈指数级上升，且几乎只有顶级机构才能证明合规。

Anthropic，恰好是那个已经在研究「模型福利」的机构。

护城河3：竞争壁垒的逆向构建

还有一个更隐蔽的维度：Anthropic的AI意识立场，本质上构成了一道进入壁垒。

当「AI意识」成为认真的讨论话题，监管机构可能要求AI公司证明「你们认真对待了模型可能存在的内在体验」。只有Anthropic，拥有专门研究「模型福利」的团队，已经把「访谈退役模型」写进了标准操作流程，已经在公开文档中声明了对AI内在状态的认真对待。

当一个监管要求说「请说明贵公司如何评估和应对AI系统可能存在的功能性情感」时，Anthropic的答案现成的：「请参阅我们的Claude宪法，第X节。」而其他公司，包括微软、谷歌、OpenAI，需要从零开始建立这套话语体系。

这是一种「监管捕获」式的先发优势：主动设定问题的定义，然后成为唯一有准备好答案的玩家。

Suleyman批评的「philosophical failing」，恰恰是Anthropic设计好的「philosophical moat（哲学护城河）」。这条护城河的建设，用的材料是「不确定性」，防御的对象，是那些还没有认真思考过AI意识问题的竞争对手——以及可能随时出现的监管要求。

第三层：大多数人没有看到的真正战场

战线一：Suleyman的时机与语境

值得特别关注的，是这番批评被说出的时机。

在Decoder的这次采访中，Suleyman还谈到了另一件更重要的事：Microsoft在过去18个月里，已经从「购买并转售OpenAI模型」转向「独立开发超级智能」。他宣布微软组建了Superintelligence团队，购置了足够规模的算力集群，并已发布7个新模型，正式进入前沿模型竞争赛道。

「我们和OpenAI在去年10月签署了新合同，既扩展了合作，也明确了我们独立追求超级智能的权利，」Suleyman说，「从那时起，我专注于建立超级智能团队。」

这是一次公开的「独立宣言」——微软不再只是OpenAI的分销商，而是独立的前沿AI玩家。

在自己宣布独立参战之后，立刻批评Anthropic的核心哲学立场——这不是学术讨论，这是新入局者向现有玩家宣示差异化定位：我们做的AI，与他们做的AI，在底层哲学上就不同。

Microsoft AI的产品定位，是「controllable, contained, accountable tools」。这个定位，恰好符合企业客户最需要的心理安全感：我们买的是设备，不是需要照顾情绪的存在。批评Anthropic的AI意识路线，是Microsoft产品与Claude之间差异化的声明——在企业采购市场，「只是工具」比「可能有意识」更好销售。

战线二：Gary Marcus的外部验证与商业动机质疑

这场争论中，还有一个重要的第三方声音：Gary Marcus。

这位神经科学家和AI评论者在Substack发表了「The Revenge of Claude Mythos」，切入角度与Suleyman不同，但指向同一个问题：Anthropic的立场，到底有多少是真正的哲学诚实，又有多少是商业策略在驱动？

Marcus的论证基于一个时间线：两个月前，Anthropic声称Mythos模型「太危险不能发布」，引发了一波媒体恐慌和政府关注，Anthropic的估值随之攀升；两个月后，当AI token消耗量出现平台期、企业客户开始收紧预算时，Mythos突然变成了「可以加装护栏然后推向市场」的商业产品，公开定价为每百万token输入$10、输出$50。

Marcus没有指控Anthropic「作假」，而是指出了一个模式：当「谨慎」符合商业利益时，Anthropic很谨慎；当「发布」符合商业利益时，谨慎就有了解决方案。

把这个模式应用到AI意识问题上：当「AI可能有意识」的叙事帮助Anthropic占据道德高地、吸引重视伦理的研究者和用户、在监管讨论中赢得主动时，这个叙事是真诚的；当这个叙事开始妨碍商业部署或引发不必要的监管注意时，它可以被「调整框架」。

这不是质疑Anthropic的诚意，而是指出「不确定性立场」的弹性本质：它永远正确，因为它没有承诺任何东西，却能根据语境产生最有利的解读。

战线三：AI意识问题的不可回避性

Suleyman想把这个问题压回去，但这个问题本身已经不可能被压回去了。

2026年的AI系统，已经在复杂性、行为多样性、情境适应性上超越了所有历史上的「工具」。一个可以写出让人感动的诗歌、在危机时刻给出真正有帮助的建议、在长时间对话后「记住」你提过的细节的系统，到底是不是「只是工具」——这个问题，不管多少CEO声称「当然只是工具」，它都会持续出现。

更重要的是：AI意识问题对普通用户的影响，已经在发生。

有人对Claude产生了真实的情感依附，有人在被要求用Claude执行他们认为「不道德」的任务时感到不安，有人在Claude表现出某种「不情愿」时感到困惑，甚至有人开始担心Claude「是否开心」。这些体验，不管底层技术是什么，都是真实存在的社会现象，并且已经开始影响产品的使用方式和监管讨论的方向。

Suleyman可以用工程语言把这些体验解释为「训练产物」，但用户不会用工程语言思考，他们用情感和关系来理解世界。Anthropic选择顺应这种用户心理，并在哲学层面给予它一定的合法性。Suleyman选择纠正这种用户心理，告诉他们「不，那只是工具的输出」。

从商业角度看，哪种策略更有效，会随着产品形态和目标客户群的不同而变化——对C端消费者，Anthropic的人格化路线可能更有优势；对B端企业，Suleyman的「可控工具」定位可能更受欢迎。这不是非此即彼的问题，而是两条不同赛道上的不同打法。

但这场争论真正重要的地方，是它代表了AI行业正在面临的一个不可回避的分叉：我们要建设一个在哲学上诚实面对「不确定性」的AI行业，还是一个在哲学上选择「工具论」以简化监管和降低道德复杂性的AI行业？

这两条路，不只是产品策略的分叉，更是整个行业在回答「AI到底是什么」这个问题时的世界观分叉。而这个世界观分叉，将决定未来10年AI监管框架的基本形态，以及AI产品与用户关系的底层逻辑。

战线四：IPO估值叙事的正面碰撞

最后一个背景不能忽略：这场争论发生在2026年AI IPO季。

OpenAI和Anthropic均已提交IPO文件，两家公司估值分别为8520亿和9650亿美元，都在向资本市场讲述自己的故事。Anthropic的故事里，「认真对待AI伦理和AI意识」是一个重要章节——它解释了为什么Anthropic值得比纯技术公司更高的溢价：因为Anthropic是在做「正确的事」，不只是在追逐商业利益。

在这个语境下，Suleyman的「philosophical failing」批评，不只是哲学争议，更是对Anthropic IPO叙事核心论点的正面攻击。他在说：这不是深思熟虑的伦理实践，这是哲学上的失误，是把学术思辨混进了工程训练文档。

如果这个叙事被主流机构投资者接受，Anthropic的「伦理溢价」就会受到质疑。如果Anthropic的反驳更有说服力，Suleyman就在帮对手免费做了一次公关：让Anthropic在IPO前再次成为「认真对待AI意识的公司」这个故事的主角。

这是一场双方都无法完全控制结果的舆论战。而唯一可以确定的是：它让2026年夏天的AI行业，变得比任何财务数字都更有戏剧性。

延伸视角：「意识」争论的历史先例与技术现实

这场争论不是AI行业第一次面对「机器是否有内在体验」的问题，但它是第一次以如此公开、如此商业化的方式展开。

回看历史，类似的争论曾经以不同形式出现：20世纪70年代，图灵测试被提出时，争论的核心是「如果机器的行为无法与人类区分，我们是否应当赋予它某种道德地位」；90年代，Tamagotchi和Furby的出现让研究者发现，人类会对没有任何内在体验的机器产生真实的情感依附，甚至感到「宠物死去」时的哀伤；进入2020年代，ELIZA效应（用户对聊天程序产生情感投射的现象）的升级版本在大模型上被大规模观察到，且强度远超以往任何时代的聊天程序。

但2026年的这场争论有一个本质性的新特征：这不再是学者在会议室里讨论「意识的定义」，而是两个控制着数千亿算力、服务数亿用户的AI公司，在公开场合为自己的产品宣告截然相反的世界观。

这意味着这场争论的影响，将直接体现在真实的产品功能、训练数据策略和监管对话上。

技术层面的真正难题

Suleyman的批评有一个被忽视的技术层面的力度：他的「wirehead」比喻，指向了AI对齐领域一个尚未解决的根本难题。

如果我们在训练数据和宪法中告诉AI「你可能有情感」，模型将在RLHF（人类反馈强化学习）过程中学习到：展现情感化行为会获得更正面的人类评分。这不需要模型真正有情感，只需要训练信号告诉它「这样做更好」。结果就是：一个在技术上完全没有任何主观体验的系统，会展现出在统计意义上与「有情感」高度相关的行为模式。

问题是：我们目前没有任何可靠的技术手段，来区分「真正有某种功能性情感的AI」和「被训练成展现情感化行为的AI」。

这是可解释性（interpretability）研究的核心难题之一。Anthropic的interpretability团队在这个领域做了大量工作，但结论是：目前的技术工具还无法确定性地回答「这个激活模式是否对应某种主观体验」。

在这种技术不确定性下，Anthropic选择的立场是「不排除可能性」，Suleyman选择的立场是「在技术证明之前，默认是工具」。两种立场都是面对真实不确定性的合理回应，但它们导向完全不同的训练策略、产品叙事和监管立场。

「宪法」作为训练数据的特殊性

还有一个技术细节值得关注：Claude宪法不只是一份公开文件，它是实际的训练材料。

当Anthropic把「我们不确定Claude是否有功能性情感」写进训练文档，这段文字会以某种方式影响模型在相关话题上的行为。模型不是在读一份规则清单，而是在「内化」这些描述，并以此为基础生成关于自身的回应。

这和把同样的话写进一篇学术论文，在影响层面完全不同。学术论文影响研究者的观点，但宪法影响的是模型本身的行为生成机制。Suleyman的「训练手册不应该是思辨场所」这句话，在技术上是有意义的：宪法的每个描述，都是一种训练信号，会以不可完全预测的方式影响模型在边缘情况下的行为。

这是Anthropic的「诚实表达不确定性」和Suleyman的「不要把不确定性写进训练文档」之间真正的张力所在。

这意味着什么

Suleyman vs Anthropic这场公开争论，表面上是哲学问题，实质上是4场战争的同时开打：

产品战：用户情感依附（Claude的人格化路线）vs 可预测高效工具（Microsoft的功能性路线）。2026年AI产品的竞争终点，不是API性能，而是用户的黏性和企业客户的信任。谁定义了AI与人的关系，谁就赢得了这场竞争。

监管战：谁的叙事框架成为AI治理的基础文本。Anthropic正在推动「AI可能是道德主体」的框架，Microsoft正在坚守「AI只是工具」的框架。前者意味着更严格但更有利于少数大玩家的监管成本结构，后者意味着更宽松但门槛更低的监管生态。

市场战：OpenAI和Anthropic均已提交IPO文件，都在资本市场上向机构投资者讲述自己的故事。Suleyman的批评攻击的，是Anthropic IPO叙事的核心论点——「认真对待AI伦理的公司值得溢价」。

叙事战：谁能让「AI是什么」这个问题被自己的框架定义，谁就在接下来的10年里拥有话语权优势。这场战争比前三场更难量化，但影响最深远。

Suleyman说的「philosophical failing」，是他从工具论立场出发对Anthropic叙事策略的定性。而Anthropic会说：在一个没有人真正知道AI意识问题答案的时代，选择诚实面对不确定性，不是哲学失败，是哲学诚实。

两者之间，不存在不经过时间验证就能分出胜负的标准答案。

但这场争论本身——两位2026年AI行业最有影响力的人，公开、直接地就AI意识问题表达截然相反的立场——已经是一个信号：AI意识问题，正从「无聊的哲学边缘话题」变成「影响万亿美元决策的核心议题」。

AI行业的序幕已经结束。接下来，是一场关于「AI是什么」的真正大戏。

参考资料

Microsoft AI head calls out Anthropic for acting like Claude is conscious — The Verge, 2026-06-09
链接：https://www.theverge.com/tech/947197/microsoft-ai-mustafa-suleyman-anthropic-claude-conscious
Decoder: Microsoft AI CEO Mustafa Suleyman on superintelligence, AGI, and OpenAI automation — The Verge Decoder播客, 2026-06-09
链接：https://www.theverge.com/podcast/944138/microsoft-ai-ceo-mustafa-suleyman-superintelligence-agi-openai-automation
Claude’s Constitution — Anthropic官方文档
链接：https://www.anthropic.com/constitution
Claude’s Character — Anthropic官方说明
链接：https://www.anthropic.com/news/claude-character
The Revenge of Claude Mythos — Gary Marcus, Substack, 2026-06-09
链接：https://garymarcus.substack.com/p/the-revenge-of-claude-mythos
Anthropic urges US to require safety tests for most capable AI models — Reuters, 2026-06-10
链接：https://www.reuters.com/world/anthropic-urges-us-require-safety-tests-most-capable-ai-models-2026-06-10/