当科学家也不再亲自写代码：1260人调查揭示AI编程Agent的「隐性阶层革命」

2026年3月，一位在美国中西部公立大学任教的政治学副教授对学生说了一句话，在推特上被广泛转发：「我的同事用Claude Code一周写完了我六个月都没完成的分析。我不知道我该学会用它，还是该担心这意味着什么。」

这句话像一面镜子，照出了学术界此刻正在经历的深层焦虑：不是「AI会不会取代我」，而是「已经在用AI的那批人，是不是已经离我很远了」。

Anthropic在2026年5月27日发布的一份调查报告，用数据回答了这个问题。结论比很多人预想的更令人不安。

一、20%：一个让人沉默的数字

这份调查覆盖了1260名量化社会科学家，调查时间是2026年2月至3月——恰好是Claude Code和Opus 4.6在学术圈掀起讨论热潮之后两个月。参与者涵盖经济学、政治学、社会学、管理科学、心理学等多个学科，约40%是正副教授，25%是助理教授，30%是博士生。

第一个数字让人意外：81%的受访者说他们用过AI聊天机器人辅助研究。这个比例高得几乎让人觉得学术界的AI革命已经发生了——十个研究者里有八个，都已经在某种程度上让AI参与了他们的学术工作。

然后第二个数字落下来，像一盆冷水：只有20%的人真正将coding agent纳入了日常工作流。

这里的「coding agent」不是泛指AI工具，而是特指能自主写代码、运行分析、解读结果、反复迭代的工具——比如Claude Code、Codex、Cursor。这类工具和ChatGPT最大的区别在于：它们不是回答问题的，它们是代替你执行研究任务的。你给它一个数据集和一个研究问题，它能自主完成从数据清洗到统计分析、从结果解读到可视化图表的全部流程，甚至当它发现某个方法不work时，还会自动换一个方法重试。

从81%到20%，这中间的60个百分点，就是当前AI工具在学术界的真实边界：人们在用AI当「写作助手」，但他们还没有让AI当「研究伙伴」。更准确地说，大多数人在用AI做局部替代——让它帮忙改改段落、写写摘要、解释某个统计概念——但真正把研究流程的核心部分交出去的，只有五分之一。

Anthropic的数据进一步细化了这道鸿沟：在已经尝试过AI辅助研究的受访者里，选择深入采用coding agent的比例，其实比总体样本里还要低一点。换句话说，「用过AI」和「真正上手coding agent」之间，有一道比大多数人想象的都要深的认知沟壑。即使是对AI已经有过接触的人，也有很大一部分没能跨过这道坎。

二、Claude Code的统治地位：一个关键数字

在那20%的coding agent用户里，86%选择了Claude Code作为主力工具，其次是Codex（31%），其余工具的份额更小。

这个数字在技术圈可能不算意外——Claude Code自2025年底发布后迅速成为开发者群体的顶级工具，凭借其出色的上下文理解能力和代码执行能力积累了大量口碑。但在学术界的语境里，86%这个数字的含义要严峻得多。

当一个工具在学术研究中建立如此显著的市场支配地位，它的设计哲学、训练偏好、决策逻辑，将开始渗透进数以千计的社会科学研究的方法论里。这不是抽象的担忧——它体现在非常具体的层面：

谁的数据被优先处理？当Claude Code建议使用某种回归方法而不是另一种，它的这个「建议」背后，是Anthropic的训练数据和对学术标准的理解。什么样的分析框架被工具「推荐」？当经济学家让Claude Code处理面板数据，工具默认选择固定效应还是随机效应，这不是中性的技术选择，而是方法论立场。哪类假设检验被「默认」使用？当社会学家用Claude Code做文本分析，工具倾向于某些编码方案，就是在塑造研究的解释框架。

Anthropic正在通过Claude Code，塑造未来社会科学的「研究语言」。这是一个权力的集中，只不过发生在象牙塔里，安静得几乎没有人注意到。在这个意义上，Anthropic不只是一家AI公司，它正在成为一个隐形的方法论守门人。

三、那道裂缝：谁在用，谁没用

Anthropic的调查把这道隐形的裂缝，用数据显现出来了。这是本报告最有价值的部分，也是最令人不安的部分。

学科差异：经济学家的采用率最高，达到39%；政治学家25%。但公共卫生研究者只有6%，教育学研究者仅4%，传播学研究者6%。经济学和政治学天然更依赖计量分析，对代码的需求更强，这解释了一部分差距。但更深层的解释是：代码文化更强的学科，整个生态系统的基础设施更完善——会写代码的人更多，会用AI代码工具的人也更多。工具的红利只流向已经占据优势的人。

职业阶段差异：博士生和博士后的采用率超过25%，而原文明确指出终身教授的采用率不到博士生/博士后的一半。这个发现与大多数「年轻人更懂科技」的直觉一致，但其背后有一个令人不安的结构性含义：那些在学科里还没有稳定地位的年轻研究者，正在用AI工具赌一个更大的生产力优势——而那些已经功成名就的教授，可以选择不碰这些工具而不受惩罚。AI正在成为一种属于「仍在竞争中的人」的工具，而不是所有人共享的生产力提升。这意味着什么？意味着AI工具不会让学术职业阶梯更公平，它可能只是给竞争者又加了一个武器，让跑道更快，却未必让起跑线更平。

性别差异：这是调查里最让人停下来思考的数字。具有男性典型名字的研究者，采用coding agent的比例是女性的2倍以上（统计显著性p<0.05）。报告特别指出，这个差距不仅仅反映「是否尝试过AI」的层面——在已经尝试过AI工具的受访者里，男女之间在coding agent深度采用上的差距，反而比总体样本里更大。

更关键的是：这个性别差距在控制了学科和职业阶段之后依然存在。这意味着，这不只是「女性更多分布在AI采用率低的学科」这种组合效应，而是在相同学科、相同职业阶段下，女性研究者深度使用AI工具的概率就是更低。调查没有给出解释，但它隐约指向一个方向：编程文化本身的性别化偏见，在AI工具时代被进一步放大了。进入「会用代码的学者」这个圈子已经有性别门槛，进入「会用AI编码工具的学者」这个更小的圈子，门槛还要高一层。

机构差异：在Nature Index全球排名前25名的顶尖大学，研究者采用coding agent的比例比其他机构高出40%。这个数字背后的逻辑是双重的：一方面，顶尖大学有更多资源购买AI工具订阅、提供培训支持；另一方面，顶尖大学的研究文化更鼓励技术实验、容忍失败。结果就是：资源更丰富的机构，最先获得新工具的收益；而原本资源就更少的机构，则在AI时代进一步落后。学术界的马太效应，在AI工具这里，又获得了一次新的加强。

把这四个维度叠加起来，一幅图像变得清晰：AI coding agent的受益者，目前主要是年轻的、男性的、在顶尖大学工作的、从事计量经济学或政治学的研究者。这不是随机的，这是现有学术权力结构的一次技术版映射，然后在这个映射上按下了加速键。

四、他们在用它做什么：出乎意料的答案

大众对「学者用AI」的想象，往往停留在「让AI帮写论文」上。调查的数据颠覆了这个想象。

在coding agent用户里，97%用它来生成数据分析代码，这是绝对第一位的用途。其次是编辑文字（prose editing），再往后才是咨询研究方法和查找文献背景。而用AI直接起草论文段落的，在所有AI用户里只占大约三分之一，而且这个比例在学科间差异很大——经济学家和管理科学研究者用AI起草文字更常见，其他学科相对少见。

这个数据告诉我们：学者们用AI工具的方式，比公众想象的更「劳动密集型」，也更「高价值」。他们不是在让AI代写，而是在让AI执行那些枯燥、耗时、但又需要一定技术门槛的数据处理工作——清洗数据集、运行回归、生成图表、调试代码。这些工作以前需要几天或几周，现在可能几个小时就完成了。

这个发现的政策含义是深远的。如果AI主要被用于写作，学术机构的应对策略就是「规范引用AI内容」；但如果AI主要被用于数据分析，那「学术诚信」的问题就需要在一个完全不同的框架里讨论——当一项研究的分析完全由AI执行，署名研究者真正「理解」了这项研究吗？期刊审稿的方式是否需要改变？这些问题，现在学术界还没有统一的答案。

五、生产力溢价：用了和没用的，差在哪里

Anthropic的调查尝试比较了coding agent用户和非用户的研究产出差异。结论是：coding agent用户发布了更多工作论文，也提交了更多基金申请——但在期刊投稿数量上，两组并没有显著差异。

这个结果很有意思，也很微妙。工作论文和基金申请，代表的是研究流程中的「早期产出」：快速产生想法、验证假设、构建初步框架。Coding agent似乎在加速这个阶段。研究者能更快地看到「这个想法能不能成立」的初步证据，能更快地把一个模糊的研究问题转化为一份初稿，进而转化成可以投给基金机构的申请书。

但最终走向期刊发表的环节，两组差异不大。可能的解释是：期刊发表是一个慢变量，peer review的速度不会因为作者写得更快而加快；也可能是coding agent在「洞察层」的贡献目前仍然有限——它能帮你更快跑完分析，但它不能帮你想出一个更有原创价值的研究问题。

但这里有一个更值得注意的警告：Anthropic明确指出，这是描述性比较，不能推断因果。选择深度使用coding agent的研究者，本来可能就是生产力更强的那批人——这是「早期采用者效应」，而不是工具本身让他们更高产。判断这两者的区别，恰恰是Anthropic目前正在进行的随机对照实验要回答的核心问题。

这个区别在政策层面极为重要。如果是因果关系，那学术机构应该积极推动AI工具普及，给每位研究者配上Claude Code，这会提升整体科研产出；但如果只是相关，那「让所有人都用上AI」可能并不会让「所有人都更高产」，它只是让「已经高产的人更高产」，同时给科研评价体系增加了一个新的维度差距。

六、研究者怎么看这场变革

调查的最后，研究者被问到了对AI影响的看法。一个有趣的分歧浮现出来：

研究者对AI帮助自己写出可发表论文这件事，比对AI影响整个社会科学领域这件事，要更乐观。

换成白话说：「我觉得AI能帮到我，但我担心AI会让这个领域变坏。」这是一种奇特的自利式乐观主义，同时也是一种清醒的集体担忧。

值得关注的是，这种集体担忧并非抽象的。调查中研究者明确提到了几类具体的忧虑：peer review系统将因AI生成论文的激增而过载——一旦每个人都能用coding agent快速生成数十篇工作论文，期刊编辑和同行评审者将面临前所未有的审稿压力；「AI slop」论文将成为学术期刊的新污染源——那些由AI填充统计结论但缺乏真正洞见的论文，会拉低整个领域的知识生产质量；以及多Agent自动化研究流水线的涌现，可能让整个研究范式从「研究者提出问题、AI帮助验证」演变为「AI自动发现问题、AI自动验证、研究者签字」——届时「学术研究」的主体究竟是谁，将成为一个真正的身份危机。

每个人都觉得自己能驾驭AI，同时集体担忧AI会腐蚀学术本身——这种结构在很多领域都出现过：医生觉得AI诊断有用但担心整个医疗系统被AI劣化；记者觉得AI能帮自己写稿但担心整个新闻业被AI洪水淹没。这是一种认知上的不一致，但它指向的是一个真实的集体行动问题：当每个人都在理性地选择「用AI更有竞争力」，最终造成的集体结果，可能是所有人都不想要的。

但社会科学家的担忧有其独特性：他们研究的是人类行为、社会结构、经济规律。如果AI工具开始在方法论层面统治这个领域——如果Claude Code的偏好决定了「什么样的数据处理方式是标准的」，「什么样的回归模型是合理的」——那么我们对社会的理解，将部分由一个商业AI模型的训练偏好来决定。这不是反技术的焦虑，这是认识论层面的严肃警告：当工具足够强大到能够塑造方法论，工具本身的价值观就不再是中性的了。

七、这份调查本身，也是一个信号

值得注意的是，这份报告是由Anthropic自己发布的，而Claude Code是调查中市场份额最高的工具（86%）。这里有一个很微妙的利益结构：Anthropic在发布一份证明「coding agent改变学术研究」的数据，同时它的产品是这个变化的主要受益者。

调查样本是「自愿参与研究的研究者」，有可能偏向对AI更感兴趣的人群，因此整体采用率可能被高估——这一点Anthropic在报告里自己也说了。但这不意味着数据是假的，更不意味着结论无效。

细读这份报告，能看到一种刻意的数据诚实：Anthropic没有只挑对自己有利的数字，而是把那些不舒服的发现一起放出来了。性别差距：调查显示女性研究者的采用率仅为男性的一半，这种差距对一家标榜「有益AI」的公司而言，不是值得宣传的数据。机构差距：顶校研究者的采用率比一般院校高出40%，这意味着Anthropic的工具正在加剧学术界的结构性不平等。因果关系的局限：工作论文和基金申请的差异只是相关性，不能推断因果——Anthropic在报告里主动降低了对自己产品效果的确定性宣称。

正是因为上述数据，我们才能承认：这份调查不只是一份行业报告，也是一种值得肯定的透明度姿态。承认AI工具的采用正在制造不平等，承认这场变革的影响超出了商业领域，承认自己的产品主导了市场而这本身就值得审视——对于一家市值超过1000亿美元、正在努力推广自己产品的公司来说，这不是理所当然的。当然，这份透明本身也是一种策略——通过坦承局限来建立信任，从而让工具更深入地渗透进学术界。两者可以同时为真。

八、80%的沉默大多数，和20%的先行者之间

回到那位中西部政治学副教授说的话。

他的焦虑，代表了那80%仍在观望的研究者——他们知道变化在发生，但他们还不确定「跳进去」的代价和收益分别是什么。他们看到同事用Claude Code产出惊人，但也听说有人用AI分析出了根本无法复现的结论；他们想保持竞争力，但也不想在同行评审时被质疑「这真的是你做的分析吗」。

Anthropic的调查没有告诉他们该怎么做，但它给出了一张当前地图：最早入场的，是年轻的、男性的、在顶校工作的、从事经济学或政治学的研究者。这张图谱不是偶然的，它映射了整个学术劳动力市场里已有的权力结构——AI工具沿着既有的优势轨道流动，然后在这些轨道上按下了加速键。

真正的问题不是「AI会不会取代社会科学家」，而是：当AI工具在这些既有的轨道上加速运行，那些不在这些轨道上的人，面临的是被拉得越来越远的风险。

Anthropic承诺的那个自然实验结果发布后，我们会知道coding agent究竟是否在因果意义上提升了研究生产力。但无论那个答案是什么，这份调查已经告诉了我们一件事：AI工具的采用，目前是一个沿着既有权力线条流动的过程。改变这个方向，需要的不只是工具的进步，还需要一种有意识的、结构性的干预。

那个自然实验，其实也是一个道德实验：我们想要的，是一个AI工具帮助所有研究者都变得更好的未来，还是一个AI工具让已经更强的人变得更强的未来？

在那之前，那80%的沉默大多数，需要为自己做一个决定：等待答案，还是成为数据。

参考资料

Anthropic Research — “Coding agents in the social sciences” (2026-05-27): https://www.anthropic.com/research/coding-agents-social-sciences
本调查样本说明：面向Claude Max账号访问权研究招募，参与者具有自我选择偏差，整体AI采用率可能高于学术界平均水平；报告附录Table A1、A2提供样本分布对照数据
数字差异（性别、机构、学科）均在p<0.05水平上统计显著，控制变量分析见原始报告
关于coding agent与研究生产力的因果关系，Anthropic正在进行随机对照实验，基线数据已在本报告发布，实验结果将另行发布
市场份额数据（Claude Code 86%，Codex 31%）来自Anthropic调查中对coding agent用户的工具使用自报告，允许多选

当科学家也不再亲自写代码：1260人调查揭示AI编程Agent的「隐性阶层革命」

一、20%：一个让人沉默的数字

二、Claude Code的统治地位：一个关键数字

三、那道裂缝：谁在用，谁没用

四、他们在用它做什么：出乎意料的答案

五、生产力溢价：用了和没用的，差在哪里

六、研究者怎么看这场变革

七、这份调查本身，也是一个信号

八、80%的沉默大多数，和20%的先行者之间

参考资料

Tags:

About

Categories

Recent Posts

Resources