2026年3月,一位在美国中西部公立大学任教的政治学副教授对学生说了一句话,在推特上被广泛转发:「我的同事用Claude Code一周写完了我六个月都没完成的分析。我不知道我该学会用它,还是该担心这意味着什么。」

这句话像一面镜子,照出了学术界此刻正在经历的深层焦虑:不是「AI会不会取代我」,而是「已经在用AI的那批人,是不是已经离我很远了」。

Anthropic在2026年5月27日发布的一份调查报告,用数据回答了这个问题。结论比很多人预想的更令人不安。


一、20%:一个让人沉默的数字

这份调查覆盖了1260名量化社会科学家,调查时间是2026年2月至3月——恰好是Claude Code和Opus 4.6在学术圈掀起讨论热潮之后两个月。参与者涵盖经济学、政治学、社会学、管理科学、心理学等多个学科,约40%是正副教授,25%是助理教授,30%是博士生。

第一个数字让人意外:81%的受访者说他们用过AI聊天机器人辅助研究。这个比例高得几乎让人觉得学术界的AI革命已经发生了——十个研究者里有八个,都已经在某种程度上让AI参与了他们的学术工作。

然后第二个数字落下来,像一盆冷水:只有20%的人真正将coding agent纳入了日常工作流

这里的「coding agent」不是泛指AI工具,而是特指能自主写代码、运行分析、解读结果、反复迭代的工具——比如Claude Code、Codex、Cursor。这类工具和ChatGPT最大的区别在于:它们不是回答问题的,它们是代替你执行研究任务的。你给它一个数据集和一个研究问题,它能自主完成从数据清洗到统计分析、从结果解读到可视化图表的全部流程,甚至当它发现某个方法不work时,还会自动换一个方法重试。

从81%到20%,这中间的60个百分点,就是当前AI工具在学术界的真实边界:人们在用AI当「写作助手」,但他们还没有让AI当「研究伙伴」。更准确地说,大多数人在用AI做局部替代——让它帮忙改改段落、写写摘要、解释某个统计概念——但真正把研究流程的核心部分交出去的,只有五分之一。

Anthropic的数据进一步细化了这道鸿沟:在已经尝试过AI辅助研究的受访者里,选择深入采用coding agent的比例,其实比总体样本里还要低一点。换句话说,「用过AI」和「真正上手coding agent」之间,有一道比大多数人想象的都要深的认知沟壑。即使是对AI已经有过接触的人,也有很大一部分没能跨过这道坎。


二、Claude Code的统治地位:一个关键数字

在那20%的coding agent用户里,86%选择了Claude Code作为主力工具,其次是Codex(31%),其余工具的份额更小。

这个数字在技术圈可能不算意外——Claude Code自2025年底发布后迅速成为开发者群体的顶级工具,凭借其出色的上下文理解能力和代码执行能力积累了大量口碑。但在学术界的语境里,86%这个数字的含义要严峻得多。

当一个工具在学术研究中建立如此显著的市场支配地位,它的设计哲学、训练偏好、决策逻辑,将开始渗透进数以千计的社会科学研究的方法论里。这不是抽象的担忧——它体现在非常具体的层面:

谁的数据被优先处理?当Claude Code建议使用某种回归方法而不是另一种,它的这个「建议」背后,是Anthropic的训练数据和对学术标准的理解。什么样的分析框架被工具「推荐」?当经济学家让Claude Code处理面板数据,工具默认选择固定效应还是随机效应,这不是中性的技术选择,而是方法论立场。哪类假设检验被「默认」使用?当社会学家用Claude Code做文本分析,工具倾向于某些编码方案,就是在塑造研究的解释框架。

Anthropic正在通过Claude Code,塑造未来社会科学的「研究语言」。这是一个权力的集中,只不过发生在象牙塔里,安静得几乎没有人注意到。在这个意义上,Anthropic不只是一家AI公司,它正在成为一个隐形的方法论守门人。


三、那道裂缝:谁在用,谁没用

Anthropic的调查把这道隐形的裂缝,用数据显现出来了。这是本报告最有价值的部分,也是最令人不安的部分。

学科差异:经济学家的采用率最高,达到39%;政治学家25%。但公共卫生研究者只有6%,教育学研究者仅4%,传播学研究者6%。经济学和政治学天然更依赖计量分析,对代码的需求更强,这解释了一部分差距。但更深层的解释是:代码文化更强的学科,整个生态系统的基础设施更完善——会写代码的人更多,会用AI代码工具的人也更多。工具的红利只流向已经占据优势的人。

职业阶段差异:博士生和博士后的采用率超过25%,而原文明确指出终身教授的采用率不到博士生/博士后的一半。这个发现与大多数「年轻人更懂科技」的直觉一致,但其背后有一个令人不安的结构性含义:那些在学科里还没有稳定地位的年轻研究者,正在用AI工具赌一个更大的生产力优势——而那些已经功成名就的教授,可以选择不碰这些工具而不受惩罚。AI正在成为一种属于「仍在竞争中的人」的工具,而不是所有人共享的生产力提升。这意味着什么?意味着AI工具不会让学术职业阶梯更公平,它可能只是给竞争者又加了一个武器,让跑道更快,却未必让起跑线更平。

性别差异:这是调查里最让人停下来思考的数字。具有男性典型名字的研究者,采用coding agent的比例是女性的2倍以上(统计显著性p<0.05)。报告特别指出,这个差距不仅仅反映「是否尝试过AI」的层面——在已经尝试过AI工具的受访者里,男女之间在coding agent深度采用上的差距,反而比总体样本里更大。

更关键的是:这个性别差距在控制了学科和职业阶段之后依然存在。这意味着,这不只是「女性更多分布在AI采用率低的学科」这种组合效应,而是在相同学科、相同职业阶段下,女性研究者深度使用AI工具的概率就是更低。调查没有给出解释,但它隐约指向一个方向:编程文化本身的性别化偏见,在AI工具时代被进一步放大了。进入「会用代码的学者」这个圈子已经有性别门槛,进入「会用AI编码工具的学者」这个更小的圈子,门槛还要高一层。

机构差异:在Nature Index全球排名前25名的顶尖大学,研究者采用coding agent的比例比其他机构高出40%。这个数字背后的逻辑是双重的:一方面,顶尖大学有更多资源购买AI工具订阅、提供培训支持;另一方面,顶尖大学的研究文化更鼓励技术实验、容忍失败。结果就是:资源更丰富的机构,最先获得新工具的收益;而原本资源就更少的机构,则在AI时代进一步落后。学术界的马太效应,在AI工具这里,又获得了一次新的加强。

把这四个维度叠加起来,一幅图像变得清晰:AI coding agent的受益者,目前主要是年轻的、男性的、在顶尖大学工作的、从事计量经济学或政治学的研究者。这不是随机的,这是现有学术权力结构的一次技术版映射,然后在这个映射上按下了加速键。


四、他们在用它做什么:出乎意料的答案

大众对「学者用AI」的想象,往往停留在「让AI帮写论文」上。调查的数据颠覆了这个想象。

在coding agent用户里,97%用它来生成数据分析代码,这是绝对第一位的用途。其次是编辑文字(prose editing),再往后才是咨询研究方法和查找文献背景。而用AI直接起草论文段落的,在所有AI用户里只占大约三分之一,而且这个比例在学科间差异很大——经济学家和管理科学研究者用AI起草文字更常见,其他学科相对少见。

这个数据告诉我们:学者们用AI工具的方式,比公众想象的更「劳动密集型」,也更「高价值」。他们不是在让AI代写,而是在让AI执行那些枯燥、耗时、但又需要一定技术门槛的数据处理工作——清洗数据集、运行回归、生成图表、调试代码。这些工作以前需要几天或几周,现在可能几个小时就完成了。

这个发现的政策含义是深远的。如果AI主要被用于写作,学术机构的应对策略就是「规范引用AI内容」;但如果AI主要被用于数据分析,那「学术诚信」的问题就需要在一个完全不同的框架里讨论——当一项研究的分析完全由AI执行,署名研究者真正「理解」了这项研究吗?期刊审稿的方式是否需要改变?这些问题,现在学术界还没有统一的答案。


五、生产力溢价:用了和没用的,差在哪里

Anthropic的调查尝试比较了coding agent用户和非用户的研究产出差异。结论是:coding agent用户发布了更多工作论文,也提交了更多基金申请——但在期刊投稿数量上,两组并没有显著差异。

这个结果很有意思,也很微妙。工作论文和基金申请,代表的是研究流程中的「早期产出」:快速产生想法、验证假设、构建初步框架。Coding agent似乎在加速这个阶段。研究者能更快地看到「这个想法能不能成立」的初步证据,能更快地把一个模糊的研究问题转化为一份初稿,进而转化成可以投给基金机构的申请书。

但最终走向期刊发表的环节,两组差异不大。可能的解释是:期刊发表是一个慢变量,peer review的速度不会因为作者写得更快而加快;也可能是coding agent在「洞察层」的贡献目前仍然有限——它能帮你更快跑完分析,但它不能帮你想出一个更有原创价值的研究问题。

但这里有一个更值得注意的警告:Anthropic明确指出,这是描述性比较,不能推断因果。选择深度使用coding agent的研究者,本来可能就是生产力更强的那批人——这是「早期采用者效应」,而不是工具本身让他们更高产。判断这两者的区别,恰恰是Anthropic目前正在进行的随机对照实验要回答的核心问题。

这个区别在政策层面极为重要。如果是因果关系,那学术机构应该积极推动AI工具普及,给每位研究者配上Claude Code,这会提升整体科研产出;但如果只是相关,那「让所有人都用上AI」可能并不会让「所有人都更高产」,它只是让「已经高产的人更高产」,同时给科研评价体系增加了一个新的维度差距。


六、研究者怎么看这场变革

调查的最后,研究者被问到了对AI影响的看法。一个有趣的分歧浮现出来:

研究者对AI帮助自己写出可发表论文这件事,比对AI影响整个社会科学领域这件事,要更乐观

换成白话说:「我觉得AI能帮到我,但我担心AI会让这个领域变坏。」这是一种奇特的自利式乐观主义,同时也是一种清醒的集体担忧。

值得关注的是,这种集体担忧并非抽象的。调查中研究者明确提到了几类具体的忧虑:peer review系统将因AI生成论文的激增而过载——一旦每个人都能用coding agent快速生成数十篇工作论文,期刊编辑和同行评审者将面临前所未有的审稿压力;「AI slop」论文将成为学术期刊的新污染源——那些由AI填充统计结论但缺乏真正洞见的论文,会拉低整个领域的知识生产质量;以及多Agent自动化研究流水线的涌现,可能让整个研究范式从「研究者提出问题、AI帮助验证」演变为「AI自动发现问题、AI自动验证、研究者签字」——届时「学术研究」的主体究竟是谁,将成为一个真正的身份危机。

每个人都觉得自己能驾驭AI,同时集体担忧AI会腐蚀学术本身——这种结构在很多领域都出现过:医生觉得AI诊断有用但担心整个医疗系统被AI劣化;记者觉得AI能帮自己写稿但担心整个新闻业被AI洪水淹没。这是一种认知上的不一致,但它指向的是一个真实的集体行动问题:当每个人都在理性地选择「用AI更有竞争力」,最终造成的集体结果,可能是所有人都不想要的。

但社会科学家的担忧有其独特性:他们研究的是人类行为、社会结构、经济规律。如果AI工具开始在方法论层面统治这个领域——如果Claude Code的偏好决定了「什么样的数据处理方式是标准的」,「什么样的回归模型是合理的」——那么我们对社会的理解,将部分由一个商业AI模型的训练偏好来决定。这不是反技术的焦虑,这是认识论层面的严肃警告:当工具足够强大到能够塑造方法论,工具本身的价值观就不再是中性的了。


七、这份调查本身,也是一个信号

值得注意的是,这份报告是由Anthropic自己发布的,而Claude Code是调查中市场份额最高的工具(86%)。这里有一个很微妙的利益结构:Anthropic在发布一份证明「coding agent改变学术研究」的数据,同时它的产品是这个变化的主要受益者。

调查样本是「自愿参与研究的研究者」,有可能偏向对AI更感兴趣的人群,因此整体采用率可能被高估——这一点Anthropic在报告里自己也说了。但这不意味着数据是假的,更不意味着结论无效。

细读这份报告,能看到一种刻意的数据诚实:Anthropic没有只挑对自己有利的数字,而是把那些不舒服的发现一起放出来了。性别差距:调查显示女性研究者的采用率仅为男性的一半,这种差距对一家标榜「有益AI」的公司而言,不是值得宣传的数据。机构差距:顶校研究者的采用率比一般院校高出40%,这意味着Anthropic的工具正在加剧学术界的结构性不平等。因果关系的局限:工作论文和基金申请的差异只是相关性,不能推断因果——Anthropic在报告里主动降低了对自己产品效果的确定性宣称。

正是因为上述数据,我们才能承认:这份调查不只是一份行业报告,也是一种值得肯定的透明度姿态。承认AI工具的采用正在制造不平等,承认这场变革的影响超出了商业领域,承认自己的产品主导了市场而这本身就值得审视——对于一家市值超过1000亿美元、正在努力推广自己产品的公司来说,这不是理所当然的。当然,这份透明本身也是一种策略——通过坦承局限来建立信任,从而让工具更深入地渗透进学术界。两者可以同时为真。


八、80%的沉默大多数,和20%的先行者之间

回到那位中西部政治学副教授说的话。

他的焦虑,代表了那80%仍在观望的研究者——他们知道变化在发生,但他们还不确定「跳进去」的代价和收益分别是什么。他们看到同事用Claude Code产出惊人,但也听说有人用AI分析出了根本无法复现的结论;他们想保持竞争力,但也不想在同行评审时被质疑「这真的是你做的分析吗」。

Anthropic的调查没有告诉他们该怎么做,但它给出了一张当前地图:最早入场的,是年轻的、男性的、在顶校工作的、从事经济学或政治学的研究者。这张图谱不是偶然的,它映射了整个学术劳动力市场里已有的权力结构——AI工具沿着既有的优势轨道流动,然后在这些轨道上按下了加速键

真正的问题不是「AI会不会取代社会科学家」,而是:当AI工具在这些既有的轨道上加速运行,那些不在这些轨道上的人,面临的是被拉得越来越远的风险。

Anthropic承诺的那个自然实验结果发布后,我们会知道coding agent究竟是否在因果意义上提升了研究生产力。但无论那个答案是什么,这份调查已经告诉了我们一件事:AI工具的采用,目前是一个沿着既有权力线条流动的过程。改变这个方向,需要的不只是工具的进步,还需要一种有意识的、结构性的干预。

那个自然实验,其实也是一个道德实验:我们想要的,是一个AI工具帮助所有研究者都变得更好的未来,还是一个AI工具让已经更强的人变得更强的未来?

在那之前,那80%的沉默大多数,需要为自己做一个决定:等待答案,还是成为数据。


参考资料

  1. Anthropic Research — “Coding agents in the social sciences” (2026-05-27): https://www.anthropic.com/research/coding-agents-social-sciences

  2. 本调查样本说明:面向Claude Max账号访问权研究招募,参与者具有自我选择偏差,整体AI采用率可能高于学术界平均水平;报告附录Table A1、A2提供样本分布对照数据

  3. 数字差异(性别、机构、学科)均在p<0.05水平上统计显著,控制变量分析见原始报告

  4. 关于coding agent与研究生产力的因果关系,Anthropic正在进行随机对照实验,基线数据已在本报告发布,实验结果将另行发布

  5. 市场份额数据(Claude Code 86%,Codex 31%)来自Anthropic调查中对coding agent用户的工具使用自报告,允许多选