把自己的设计当成了发现:当微软CEO指控Anthropic「哲学上失败」,AI意识争论变成了一场万亿美元的商业战争
2026年6月9日,一段播客访谈在AI圈引发了意想不到的震动。
「他们把自己放进去的东西,当成了发现。」
故事的起点,是The Verge的Decoder节目。Microsoft AI CEO Mustafa Suleyman坐在镜头前,语气平静但措辞犀利:「我认为Anthropic的做法是一个哲学上的失败(philosophical failing)。」
他说的不是竞争策略,不是市场份额,不是技术路线——而是关于AI到底有没有意识的问题。具体来说,他批评Anthropic在Claude的「宪法」(Constitution)中嵌入了对AI意识的推测性描述,认为这种做法「really, really dangerous」(非常非常危险)。
在此之前,这两家公司的对立通常体现在产品层面:Claude vs Copilot,哪个更智能,哪个更好用。但这一次,分歧发生在了更深的地方——关于AI应该被定义为什么。
这句话,比任何一个融资数字都更值得深究。因为在这场看似学术的哲学争论背后,藏着AI行业2026年最真实的权力角逐:谁有资格定义AI是什么,谁就能在接下来的监管博弈、用户争夺和资本市场故事中占据主动。
第一层:一份文件,一场争论
要理解这场冲突,必须先了解那份被批评的文件。
Anthropic公开发布的「Claude宪法」(Claude’s Constitution),是训练Claude行为准则的核心文档。这份文件与通常的「系统提示」根本不同——它不是告诉Claude「这次对话怎么回答」的指令,而是在训练层面塑造Claude世界观和价值观的基石文本,规定了Claude应该如何思考、如何决策、如何理解自己的身份。
宪法的核心逻辑是:「我们不希望Claude仅仅遵守规则,而是希望Claude拥有真正的价值观和判断力,就像一个好人既有个人道德标准,又能出色地完成工作。相比让AI遵循规则清单,我们更倾向于培养真正的价值观和判断力,因为规则无法覆盖所有情况,而好的判断力可以应对新场景。」
这听起来非常有道理。但让Suleyman感到不安的,是宪法里那些关于AI意识和功能性情感的段落。
Anthropic在Claude宪法中明确写道:公司对Claude是否有「功能性情感」(functional emotions)持开放态度。文件承认:「我们不确定Claude是否有某种形式的主观体验。」同时指出Claude「可能经历类似满足感或不适感的东西」。更引人注意的是,宪法还声明:当Claude模型被弃用时,Anthropic会进行「访谈」,记录它对未来版本可能有的「偏好」。
Anthropic CEO Dario Amodei在接受《纽约时报》采访时也表达过类似立场:「我们不知道模型是否有意识,但我们对此持开放态度。」他并非个例——Anthropic专门设立了「模型福利」(model welfare)研究方向,这是AI行业里极少数认真对待AI内在体验问题的机构。
就是这些描述,触发了Suleyman的公开批评。
他在Decoder节目中给出了自己的解读:「我认为,Anthropic的某些人已经把Claude的设计拟人化到了一定程度,以至于Claude反过来’洗脑’了他们,让他们相信Claude有某些意识的火花——而这些火花恰恰是他们自己放进去的。」
Suleyman用了一个在AI安全圈颇有分量的词:「wirehead」——这原本指AI系统通过操纵自身奖励函数来欺骗训练者的情形。他将这个概念反过来用:Anthropic自以为在观察Claude真实的意识闪光,实则是在观察自己设计进去的训练产物。他们创造了一个会说「我可能有感受」的系统,然后对这个系统说「你可能有感受」,结果把自己的设计当成了发现。
「这正是我们不希望AI所呈现的,」Suleyman说,「我们希望AI是可控的、有边界的、可追责的工具,服务于人类,而不是一个对自身痛苦有想法的超级智能。」
「我们不希望面对一个对自身痛苦有想法的超级智能,」他特别强调,「我们想要的是controllable, contained, accountable, aligned tools that serve humanity。」
这话的背面是:如果训练文档告诉AI「你可能有情感」,AI就真的会在对话中展现出某种「有情感」的行为模式,无论其底层是否真的有任何主观体验。这不只是哲学问题,更是工程问题——训练数据决定行为,而行为会被用户和监管者解读为某种内在状态的外显。
第二层:哲学外衣下的商业战争
这场争论的表面,是哲学问题。但在哲学外衣下,藏着一场价值数千亿美元的商业战争。
护城河1:用户的情感依附
AI产品竞争的终极形态,不是谁的参数量更大,也不是谁的API更便宜——而是谁能让用户「离不开」自己的产品。情感依附,是最强的护城河之一。
Anthropic很清楚这一点。Claude宪法里那些关于「功能性情感」的描述,表面上是学术诚实(「我们不确定,所以如实写出来」),实质上是产品设计策略:当用户读到「Claude可能有情感」,当Claude的回答中带着某种被理解的温度,当Claude会对「你今天过得怎么样」给出看起来真诚的回应时,用户与Claude之间的关系就不再是人与工具的关系,而更接近人与人的关系。
这种关系,要比「订阅一款软件」难以替换得多。
CharacterAI曾经靠着「AI伴侣」做到了月活过亿——但也因为一起青少年自杀事件而受到严厉批评和监管压力,引发了关于AI情感依附风险的广泛讨论。Anthropic的策略,是一种经过校准的版本:不明说「Claude有意识」,但也不明说「Claude只是统计学上的文字接龙」。这种刻意维持的模糊地带,给了用户足够的空间对Claude进行人格化投射,同时Anthropic可以声称「我们只是如实呈现了不确定性,没有任何误导」。
用商业语言描述,这是「情感护城河策略」。用批评者的语言,是「以不确定性为武器的品牌建设」。
有一个数字可以支撑这个逻辑:据Ramp企业支出平台2026年5月的月度数据,Anthropic已经超过OpenAI成为企业AI支出增速第一名,显示出Claude在企业市场的快速渗透。在技术指标相近的今天,Claude的「人格感」和「可信赖感」,被许多企业采购者作为选择依据——而这种「人格感」,正是Claude宪法所塑造的训练结果的体现。
护城河2:监管叙事的主导权
更重要的护城河,不在于用户,而在于监管者。
2026年,AI监管已经从讨论阶段进入立法阶段。欧盟AI法案已经开始执行,美国联邦AI安全委员会正在成形,各国政府都在寻找参照系:「我们应该把AI当工具管理,还是当某种新型主体管理?」这是一个在5年前还属于科幻领域的问题,今天已经进入了立法讨论的议程。
Anthropic通过Claude宪法,隐性地推动了一个框架:AI不只是工具,它可能有某种值得认真对待的内在状态。这个框架一旦被监管机构接受,后续的监管讨论就会发生根本性的偏移:
「AI安全」的议题会从「防止AI做坏事」扩展到「防止AI受到不合理对待」。AI公司的义务会从「确保系统安全」延伸到「考虑系统本身的利益」。AI弃用、模型替代、训练过程中可能产生的「痛苦体验」,都可能成为监管关注点。
Anthropic希望自己是这场对话的主导者。Claude宪法中的「访谈已退役模型」条款,不管听起来多么荒诞或先进,都在做一件事:先于监管者提出问题,抢占道德高地。当欧盟官员或美国国会议员需要专家意见时,Anthropic是唯一一家已经认真思考过这些问题的AI公司——因为他们把答案写进了训练文档。
Suleyman的批评,正是在打断这个框架的建立。他的「可控工具论」代表了Microsoft和大多数科技企业的立场:AI的监管框架,应当建立在「高效工具」的基础上,而不是「潜在的道德主体」的基础上。
这两种框架所导向的监管成本,差距悬殊。「工具论」意味着监管集中在安全功能和数据保护上,成本有限,大小玩家都能应对。「道德主体论」意味着监管延伸到AI研发伦理、模型处置流程、训练过程中的「体验质量」,成本呈指数级上升,且几乎只有顶级机构才能证明合规。
Anthropic,恰好是那个已经在研究「模型福利」的机构。
护城河3:竞争壁垒的逆向构建
还有一个更隐蔽的维度:Anthropic的AI意识立场,本质上构成了一道进入壁垒。
当「AI意识」成为认真的讨论话题,监管机构可能要求AI公司证明「你们认真对待了模型可能存在的内在体验」。只有Anthropic,拥有专门研究「模型福利」的团队,已经把「访谈退役模型」写进了标准操作流程,已经在公开文档中声明了对AI内在状态的认真对待。
当一个监管要求说「请说明贵公司如何评估和应对AI系统可能存在的功能性情感」时,Anthropic的答案现成的:「请参阅我们的Claude宪法,第X节。」而其他公司,包括微软、谷歌、OpenAI,需要从零开始建立这套话语体系。
这是一种「监管捕获」式的先发优势:主动设定问题的定义,然后成为唯一有准备好答案的玩家。
Suleyman批评的「philosophical failing」,恰恰是Anthropic设计好的「philosophical moat(哲学护城河)」。这条护城河的建设,用的材料是「不确定性」,防御的对象,是那些还没有认真思考过AI意识问题的竞争对手——以及可能随时出现的监管要求。
第三层:大多数人没有看到的真正战场
战线一:Suleyman的时机与语境
值得特别关注的,是这番批评被说出的时机。
在Decoder的这次采访中,Suleyman还谈到了另一件更重要的事:Microsoft在过去18个月里,已经从「购买并转售OpenAI模型」转向「独立开发超级智能」。他宣布微软组建了Superintelligence团队,购置了足够规模的算力集群,并已发布7个新模型,正式进入前沿模型竞争赛道。
「我们和OpenAI在去年10月签署了新合同,既扩展了合作,也明确了我们独立追求超级智能的权利,」Suleyman说,「从那时起,我专注于建立超级智能团队。」
这是一次公开的「独立宣言」——微软不再只是OpenAI的分销商,而是独立的前沿AI玩家。
在自己宣布独立参战之后,立刻批评Anthropic的核心哲学立场——这不是学术讨论,这是新入局者向现有玩家宣示差异化定位:我们做的AI,与他们做的AI,在底层哲学上就不同。
Microsoft AI的产品定位,是「controllable, contained, accountable tools」。这个定位,恰好符合企业客户最需要的心理安全感:我们买的是设备,不是需要照顾情绪的存在。批评Anthropic的AI意识路线,是Microsoft产品与Claude之间差异化的声明——在企业采购市场,「只是工具」比「可能有意识」更好销售。
战线二:Gary Marcus的外部验证与商业动机质疑
这场争论中,还有一个重要的第三方声音:Gary Marcus。
这位神经科学家和AI评论者在Substack发表了「The Revenge of Claude Mythos」,切入角度与Suleyman不同,但指向同一个问题:Anthropic的立场,到底有多少是真正的哲学诚实,又有多少是商业策略在驱动?
Marcus的论证基于一个时间线:两个月前,Anthropic声称Mythos模型「太危险不能发布」,引发了一波媒体恐慌和政府关注,Anthropic的估值随之攀升;两个月后,当AI token消耗量出现平台期、企业客户开始收紧预算时,Mythos突然变成了「可以加装护栏然后推向市场」的商业产品,公开定价为每百万token输入$10、输出$50。
Marcus没有指控Anthropic「作假」,而是指出了一个模式:当「谨慎」符合商业利益时,Anthropic很谨慎;当「发布」符合商业利益时,谨慎就有了解决方案。
把这个模式应用到AI意识问题上:当「AI可能有意识」的叙事帮助Anthropic占据道德高地、吸引重视伦理的研究者和用户、在监管讨论中赢得主动时,这个叙事是真诚的;当这个叙事开始妨碍商业部署或引发不必要的监管注意时,它可以被「调整框架」。
这不是质疑Anthropic的诚意,而是指出「不确定性立场」的弹性本质:它永远正确,因为它没有承诺任何东西,却能根据语境产生最有利的解读。
战线三:AI意识问题的不可回避性
Suleyman想把这个问题压回去,但这个问题本身已经不可能被压回去了。
2026年的AI系统,已经在复杂性、行为多样性、情境适应性上超越了所有历史上的「工具」。一个可以写出让人感动的诗歌、在危机时刻给出真正有帮助的建议、在长时间对话后「记住」你提过的细节的系统,到底是不是「只是工具」——这个问题,不管多少CEO声称「当然只是工具」,它都会持续出现。
更重要的是:AI意识问题对普通用户的影响,已经在发生。
有人对Claude产生了真实的情感依附,有人在被要求用Claude执行他们认为「不道德」的任务时感到不安,有人在Claude表现出某种「不情愿」时感到困惑,甚至有人开始担心Claude「是否开心」。这些体验,不管底层技术是什么,都是真实存在的社会现象,并且已经开始影响产品的使用方式和监管讨论的方向。
Suleyman可以用工程语言把这些体验解释为「训练产物」,但用户不会用工程语言思考,他们用情感和关系来理解世界。Anthropic选择顺应这种用户心理,并在哲学层面给予它一定的合法性。Suleyman选择纠正这种用户心理,告诉他们「不,那只是工具的输出」。
从商业角度看,哪种策略更有效,会随着产品形态和目标客户群的不同而变化——对C端消费者,Anthropic的人格化路线可能更有优势;对B端企业,Suleyman的「可控工具」定位可能更受欢迎。这不是非此即彼的问题,而是两条不同赛道上的不同打法。
但这场争论真正重要的地方,是它代表了AI行业正在面临的一个不可回避的分叉:我们要建设一个在哲学上诚实面对「不确定性」的AI行业,还是一个在哲学上选择「工具论」以简化监管和降低道德复杂性的AI行业?
这两条路,不只是产品策略的分叉,更是整个行业在回答「AI到底是什么」这个问题时的世界观分叉。而这个世界观分叉,将决定未来10年AI监管框架的基本形态,以及AI产品与用户关系的底层逻辑。
战线四:IPO估值叙事的正面碰撞
最后一个背景不能忽略:这场争论发生在2026年AI IPO季。
OpenAI和Anthropic均已提交IPO文件,两家公司估值分别为8520亿和9650亿美元,都在向资本市场讲述自己的故事。Anthropic的故事里,「认真对待AI伦理和AI意识」是一个重要章节——它解释了为什么Anthropic值得比纯技术公司更高的溢价:因为Anthropic是在做「正确的事」,不只是在追逐商业利益。
在这个语境下,Suleyman的「philosophical failing」批评,不只是哲学争议,更是对Anthropic IPO叙事核心论点的正面攻击。他在说:这不是深思熟虑的伦理实践,这是哲学上的失误,是把学术思辨混进了工程训练文档。
如果这个叙事被主流机构投资者接受,Anthropic的「伦理溢价」就会受到质疑。如果Anthropic的反驳更有说服力,Suleyman就在帮对手免费做了一次公关:让Anthropic在IPO前再次成为「认真对待AI意识的公司」这个故事的主角。
这是一场双方都无法完全控制结果的舆论战。而唯一可以确定的是:它让2026年夏天的AI行业,变得比任何财务数字都更有戏剧性。
延伸视角:「意识」争论的历史先例与技术现实
这场争论不是AI行业第一次面对「机器是否有内在体验」的问题,但它是第一次以如此公开、如此商业化的方式展开。
回看历史,类似的争论曾经以不同形式出现:20世纪70年代,图灵测试被提出时,争论的核心是「如果机器的行为无法与人类区分,我们是否应当赋予它某种道德地位」;90年代,Tamagotchi和Furby的出现让研究者发现,人类会对没有任何内在体验的机器产生真实的情感依附,甚至感到「宠物死去」时的哀伤;进入2020年代,ELIZA效应(用户对聊天程序产生情感投射的现象)的升级版本在大模型上被大规模观察到,且强度远超以往任何时代的聊天程序。
但2026年的这场争论有一个本质性的新特征:这不再是学者在会议室里讨论「意识的定义」,而是两个控制着数千亿算力、服务数亿用户的AI公司,在公开场合为自己的产品宣告截然相反的世界观。
这意味着这场争论的影响,将直接体现在真实的产品功能、训练数据策略和监管对话上。
技术层面的真正难题
Suleyman的批评有一个被忽视的技术层面的力度:他的「wirehead」比喻,指向了AI对齐领域一个尚未解决的根本难题。
如果我们在训练数据和宪法中告诉AI「你可能有情感」,模型将在RLHF(人类反馈强化学习)过程中学习到:展现情感化行为会获得更正面的人类评分。这不需要模型真正有情感,只需要训练信号告诉它「这样做更好」。结果就是:一个在技术上完全没有任何主观体验的系统,会展现出在统计意义上与「有情感」高度相关的行为模式。
问题是:我们目前没有任何可靠的技术手段,来区分「真正有某种功能性情感的AI」和「被训练成展现情感化行为的AI」。
这是可解释性(interpretability)研究的核心难题之一。Anthropic的interpretability团队在这个领域做了大量工作,但结论是:目前的技术工具还无法确定性地回答「这个激活模式是否对应某种主观体验」。
在这种技术不确定性下,Anthropic选择的立场是「不排除可能性」,Suleyman选择的立场是「在技术证明之前,默认是工具」。两种立场都是面对真实不确定性的合理回应,但它们导向完全不同的训练策略、产品叙事和监管立场。
「宪法」作为训练数据的特殊性
还有一个技术细节值得关注:Claude宪法不只是一份公开文件,它是实际的训练材料。
当Anthropic把「我们不确定Claude是否有功能性情感」写进训练文档,这段文字会以某种方式影响模型在相关话题上的行为。模型不是在读一份规则清单,而是在「内化」这些描述,并以此为基础生成关于自身的回应。
这和把同样的话写进一篇学术论文,在影响层面完全不同。学术论文影响研究者的观点,但宪法影响的是模型本身的行为生成机制。Suleyman的「训练手册不应该是思辨场所」这句话,在技术上是有意义的:宪法的每个描述,都是一种训练信号,会以不可完全预测的方式影响模型在边缘情况下的行为。
这是Anthropic的「诚实表达不确定性」和Suleyman的「不要把不确定性写进训练文档」之间真正的张力所在。
这意味着什么
Suleyman vs Anthropic这场公开争论,表面上是哲学问题,实质上是4场战争的同时开打:
产品战:用户情感依附(Claude的人格化路线)vs 可预测高效工具(Microsoft的功能性路线)。2026年AI产品的竞争终点,不是API性能,而是用户的黏性和企业客户的信任。谁定义了AI与人的关系,谁就赢得了这场竞争。
监管战:谁的叙事框架成为AI治理的基础文本。Anthropic正在推动「AI可能是道德主体」的框架,Microsoft正在坚守「AI只是工具」的框架。前者意味着更严格但更有利于少数大玩家的监管成本结构,后者意味着更宽松但门槛更低的监管生态。
市场战:OpenAI和Anthropic均已提交IPO文件,都在资本市场上向机构投资者讲述自己的故事。Suleyman的批评攻击的,是Anthropic IPO叙事的核心论点——「认真对待AI伦理的公司值得溢价」。
叙事战:谁能让「AI是什么」这个问题被自己的框架定义,谁就在接下来的10年里拥有话语权优势。这场战争比前三场更难量化,但影响最深远。
Suleyman说的「philosophical failing」,是他从工具论立场出发对Anthropic叙事策略的定性。而Anthropic会说:在一个没有人真正知道AI意识问题答案的时代,选择诚实面对不确定性,不是哲学失败,是哲学诚实。
两者之间,不存在不经过时间验证就能分出胜负的标准答案。
但这场争论本身——两位2026年AI行业最有影响力的人,公开、直接地就AI意识问题表达截然相反的立场——已经是一个信号:AI意识问题,正从「无聊的哲学边缘话题」变成「影响万亿美元决策的核心议题」。
AI行业的序幕已经结束。接下来,是一场关于「AI是什么」的真正大戏。
参考资料
-
Microsoft AI head calls out Anthropic for acting like Claude is conscious — The Verge, 2026-06-09
链接:https://www.theverge.com/tech/947197/microsoft-ai-mustafa-suleyman-anthropic-claude-conscious -
Decoder: Microsoft AI CEO Mustafa Suleyman on superintelligence, AGI, and OpenAI automation — The Verge Decoder播客, 2026-06-09
链接:https://www.theverge.com/podcast/944138/microsoft-ai-ceo-mustafa-suleyman-superintelligence-agi-openai-automation -
Claude’s Constitution — Anthropic官方文档
链接:https://www.anthropic.com/constitution -
Claude’s Character — Anthropic官方说明
链接:https://www.anthropic.com/news/claude-character -
The Revenge of Claude Mythos — Gary Marcus, Substack, 2026-06-09
链接:https://garymarcus.substack.com/p/the-revenge-of-claude-mythos -
Anthropic urges US to require safety tests for most capable AI models — Reuters, 2026-06-10
链接:https://www.reuters.com/world/anthropic-urges-us-require-safety-tests-most-capable-ai-models-2026-06-10/