结论先行:OpenAI在6月29日发布了GPT-Rosalind——一个专为生命科学和药物研发设计的前沿推理模型,以发现DNA结构的科学家Rosalind Franklin命名。这不只是OpenAI进军医疗领域的技术动作,而是他们在”访问分级”战略上迈出的关键一步:通过”可信访问计划”(Trusted Access Program),决定谁能用上最先进的AI推理能力。这是继GPT-5.6 Sol政府审查之后,AI能力管控走向机构化的第二个里程碑。


它在做什么,做到了什么程度

GPT-Rosalind是OpenAI历史上首个为特定科学领域定制的前沿推理模型,以发现DNA双螺旋结构关键贡献者Rosalind Franklin命名。这个命名本身就是一次宣言:OpenAI要进入真正的科学前沿,而不只是科学传播。

这个模型的性能数据来自公开基准和独立第三方评估:

BixBench(围绕真实世界生物信息学和数据分析设计的基准测试)上,GPT-Rosalind取得了已发布分数中的最高成绩。在LABBench2(衡量文献检索、数据库访问、序列操作和实验方案设计等研究任务的基准)的11项任务中,GPT-Rosalind在6项上超过GPT-5.4,最显著的提升来自CloningQA任务——该任务要求模型端对端设计用于分子克隆的DNA和酶试剂方案,是典型的”只有真正懂分子生物学才能完成的任务”。

真正令人注目的是Dyno Therapeutics的独立评估。Dyno Therapeutics是一家专注AI设计基因疗法的公司,他们用未发表、未污染的RNA序列对GPT-Rosalind进行了测试——这是防止模型”背记答案”的最严格方法。57位人类AI-生物领域专家参与了同样的评估。结果:GPT-Rosalind的best-of-ten提交在序列到功能预测任务上达到人类专家的第95百分位,在序列生成任务上达到第84百分位

这意味着什么?在同样的题目上,57位顶尖专家只有2-3人的表现超过了这个模型的最佳结果。

工具生态同样值得关注:OpenAI同步发布了面向Codex的生命科学研究插件(MIT协议开源,GitHub可访问)。这个插件提供了超过50个公共多组学数据库的集成访问,覆盖人类遗传学、功能基因组学、蛋白质结构、生物化学和临床证据。Amgen、Moderna、Allen Institute、Thermo Fisher Scientific等顶级制药和生命科学机构已经成为首批合作客户。


「可信访问计划」:谁能用上最强AI

GPT-Rosalind目前只通过Trusted Access Program(可信访问计划)向”合格客户”开放研究预览。这个措辞精心设计,值得仔细分析。

合格客户的范围包括:制药公司、生物技术公司、研究机构,以及——通过Rosalind Biodefense计划——美国政府机构和盟友国家,支持公共卫生和生物防御任务。

这是OpenAI能力分级策略的最新演进,如果你把近期发布拼在一起,会看到一个清晰的层级结构正在形成:

最底层是通用公众,使用GPT-5.6(已经过政府安全审查才开放)。往上是需要白宫审核的高权限用户(GPT-5.6 Sol)。再往上是美国政府机构和盟友,通过Rosalind Biodefense计划接触生物防御专用能力。最顶层是经过机构认证的医疗和生命科学研究者,通过可信访问计划预览前沿科学推理能力。

这不是产品层级问题,而是访问权限正在成为AI时代的战略资产。在此之前,这套逻辑主要适用于国家安全;现在它已经延伸到科学研究领域。未来很可能继续延伸到法律、金融、工程等高度专业化行业。


为什么要用Rosalind Franklin命名?

OpenAI在官方声明中写道,这个模型的命名是为了纪念Rosalind Franklin,”她严谨的研究帮助揭示了DNA的结构,奠定了现代分子生物学的基础”。

但这个选择的深意远不止此。

Rosalind Franklin是科学史上最著名的”被埋没的贡献者”。她的X射线衍射照片,著名的Photograph 51,是Watson和Crick发现DNA双螺旋的关键依据。Franklin在世时从未获得诺贝尔奖——1962年的诺贝尔奖授予Watson、Crick和Wilkins,而Franklin已于1958年因卵巢癌去世,年仅37岁。历史长期对她的贡献存在争议。

在AI行业普遍面临”AI抢走科学家工作”争议的2026年,用一位被历史低估的科学家命名,是OpenAI在做一个复杂的叙事选择:这个AI不是来替代科学家的,而是来放大那些本来可能被忽视的发现。这是聪明的公关,但也有真实的技术设计在支撑——GPT-Rosalind的官方目标之一,正是”帮助研究人员发现否则可能被遗漏的联系”。


它要解决的真实问题有多大

美国FDA批准一款新药的平均周期是10到15年。这个数字在过去几十年几乎没有显著缩短,尽管计算能力增长了数百万倍。

原因不只是科学本身的难度,还有研究工作流的严重碎片化:科学家必须同时管理海量文献、专用数据库、实验数据和不断演进的假设。手动合成这些信息本身就耗费研究者大量时间——时间原本可以用来思考更重要的科学问题。

GPT-Rosalind的核心价值定位精确瞄准这个流程瓶颈,覆盖证据综合(自动整合多个数据库和文献),假设生成(基于现有数据提出新的研究方向),实验方案设计(可操作的实验步骤),以及多步骤推理工作流(在一次对话中完成以前需要数周的资料整理)。

Amgen高级副总裁Sean Bruich在首批客户评价中说得很直白:”生命科学领域每一步都需要精确性。问题高度复杂,数据高度独特,风险极高。”这个行业不需要”够用的AI”,需要的是”更少错误的AI”。


两条竞争战线

战线一:与Anthropic的正面交锋

6月30日,就在GPT-Rosalind发布的第二天,Anthropic发布了Claude Science——同样定位于科学研究的AI平台,专注于帮助科学家分析数据、管理复杂计算工作流,并同时启动了内部药物研发计划。

两家公司在同一周发布针对同一市场的产品,这不是巧合,而是双方都在争夺一个判断:生命科学是下一个高价值AI落地场景,且从通用模型到专用模型的过渡窗口期有限。

目前GPT-Rosalind和Claude Science的差异还不完全清晰,但一些轮廓已经可见:GPT-Rosalind的性能证据更具体(多个第三方基准+Dyno Therapeutics独立评估),Claude Science则更强调”药物研发内部计划”的产业落地路径。两者都是”科研AI”但切入角度略有不同——OpenAI更倾向展示模型能力边界,Anthropic更倾向展示应用场景落地。

战线二:与大型制药公司的数字化升级进程

这类模型发布的深层背景是:大型制药公司的AI投入正在从”探索期”进入”扩张期”,而预算正在向有具体性能证明的AI能力转移。Moderna和Amgen已经是GPT-Rosalind的早期客户,意味着它们的AI研发预算已经开始直接流向OpenAI,而不只是内部AI团队或学术合作。

这对以下几类竞争者构成实质性压力:

  • 微软Copilot for Healthcare:依赖Azure+GPT生态,现在面对OpenAI的直接竞争
  • Google Med-PaLM系列:Google在医疗AI的旗舰产品(Med-PaLM 2发布于2023年),但GPT-Rosalind在BixBench等专业基准上的具体数字是Med-PaLM迄今未展示的
  • 专注医疗AI的初创公司:Insilico Medicine、Recursion Pharmaceuticals等依赖自有模型的医疗AI公司,将面临来自大型通用AI公司专项化产品的直接替代压力
  • 学术软件:RDKit、PyMOL、Schrodinger等传统计算化学工具,在50+数据库集成的AI工具面前,使用场景将被快速侵蚀

三个值得深想的问题

1. 可信访问计划将如何演化为行业标准?

目前GPT-Rosalind是”研究预览”,通过可信访问计划有限开放。如果这套机制成熟,未来可能出现一套AI能力分级-认证体系:什么机构可以访问什么层级的AI能力,用于什么用途,需要提供什么资质证明。这实际上是OpenAI在AI时代重构行业入场券制度——类似金融业的合格投资者认证,或核材料的访问许可,但应用于AI推理能力领域。

2. 政府-产业AI协作的新格局

Rosalind Biodefense计划向美国政府机构和盟友开放,用于公共卫生和生物防御任务。这是一个值得关注的新协作模式:不是政府自己开发AI,也不是简单购买通用模型,而是科技公司提供经过机构认证的专项能力,政府通过”可信合作伙伴”框架获得受限访问权限。这个框架如果推广到其他敏感领域(能源、材料、国防、网络安全),将从根本上改变美国AI治理和国家竞争力的基本格局。

3. 第95百分位背后的算力成本

在Dyno Therapeutics的评估中,GPT-Rosalind用”best-of-ten”提交达到第95百分位——对同一问题运行10次,取最佳结果。在科学研究场景中这可能是合理的(研究者本人做实验也不是一次成功),但这意味着你为”最佳答案”支付的算力是普通查询的10倍。专业科学AI的真实使用成本结构,与通用对话AI将是完全不同的量级。OpenAI还没有公布Rosalind的定价模型——这个问题的答案,将决定它能否真正在普通学术机构(而不只是财力雄厚的大型药企)广泛落地。


结语:当AI开始在实验室穿白大褂

OpenAI用Rosalind Franklin命名它的生命科学AI,不是随意的致敬。这是一个精心选择的宣言:AI将进入真正的科学前沿,帮助发现那些被碎片化工作流遮蔽的洞见,放大那些本来可能被低估的贡献。

但更深层的信号在于可信访问计划的扩展逻辑。当访问最强AI能力需要机构认证、用途审查和政府合作框架,我们正在目睹一种新的权力结构成形:不是谁拥有最多算力或最多数据,而是谁被信任、谁被允许接触最先进推理能力,将成为下一个十年的关键壁垒。

药物研发10到15年的时间线,也许不会在AI介入后立刻缩短到1年。但如果科研工作流的碎片化瓶颈被消除,如果假设探索的速度快上10倍,如果每一个Rosalind Franklin式的洞见都不再被淹没在繁琐的文献整理中——那个时间线的变化,将比我们想象的来得更快。

Rosalind Franklin等了几十年才被历史正名。AI对生命科学的冲击,很可能不需要等那么久。


参考来源:

  • OpenAI官方「Introducing GPT-Rosalind for life sciences research」(2026-06-29): https://openai.com/index/introducing-gpt-rosalind/
  • CNBC「Anthropic launches AI drug discovery program」(2026-06-30): https://www.cnbc.com/2026/06/30/anthropic-launches-ai-drug-discovery-program-claude-science.html
  • TechRepublic「Claude Sonnet 5: Everything to Know」(2026-06-30)
  • Dyno Therapeutics GPT-Rosalind RNA序列独立评估(57位AI-生物领域专家对比基准,2026年)
  • BixBench生物信息学基准测试,LABBench2研究任务基准(11项任务对比)