Claude Code的「第二个产品定义时刻」:多会话工作区+Routines,Anthropic如何把IDE变成自动化基础设施
2024年,Claude Code以「终端里的AI编程助手」的形态出现,定位是帮助开发者写代码、调试和解释代码的对话工具。这是Claude Code的第一个产品形态:聊天助手。
2026年4月14日,Anthropic宣布了对Claude Code桌面应用的全面重构,这是它的第二个产品形态:多Agent并行工作区(来源:SiliconANGLE,2026-04-14)。
两个版本之间的差距,不是功能的叠加,而是产品范式的转变——从「你问我答」到「我可以同时做几件事,还可以按计划自动去做」。理解这个转变,需要看清楚Anthropic在AI开发工具这个赛道上的战略意图。
第一章:重构的具体内容——不是「AI更聪明了」,而是「工作空间变了」
这次Claude Code桌面重构的核心功能更新包括:
多会话侧边栏(Multi-session Sidebar) 最直接的变化:界面左侧现在有一个会话列表,可以同时打开多个Claude Code会话,每个会话可以在处理不同的代码仓库或不同的任务。用户可以在「给A项目的前端写组件」和「给B项目的后端查bug」之间自由切换,上下文独立保持。
这个功能看似简单,但它改变了一个根本假设:以前Claude Code是「你和AI的一对一对话」,现在是「你管理多个AI工作线程」。对于同时维护多个项目或微服务的开发者来说,这是从「分时共享」到「真正并行」的跨越。
拖拽布局(Drag-and-drop Layout) 支持把文件、代码片段、终端输出直接拖拽到Claude Code会话中,减少复制粘贴的操作成本。这是纯粹的效率改进,但在高频使用场景下累积效果显著。
内置终端和文件编辑器(Integrated Terminal + File Editor) 这是最重要的架构级变化。Claude Code不再是一个「独立的聊天窗口,偶尔和IDE交互」,而是把终端和文件编辑器直接内嵌到界面中。这意味着:AI可以直接执行命令、直接修改文件、直接看到结果,不再需要在多个工具窗口之间来回切换。
这个变化的含义是:Claude Code正在从「工具」变成「工作台(Workbench)」。
SSH会话(macOS/Linux) 支持通过SSH连接到远程服务器直接操作,这让Claude Code可以直接用于运维和远程开发场景,不再局限于本地代码库。
第二章:Routines——这才是最值得关注的功能
以上所有功能加在一起,都不如「Routines」(研究预览)对行业的意义重大。
Routines的工作方式是:
- 定义一个「例程」:指定一个Prompt(告诉AI要做什么)+ 一个代码仓库(在哪里操作)+ MCP连接器(可以调用哪些外部工具和服务)
- 设定触发条件:可以按计划执行(类似cron job:每天3am扫描安全漏洞)、通过API触发(CI/CD流水线完成后自动触发代码审查)、或通过GitHub事件触发(有PR提交时自动生成Review摘要)(注:GitHub事件触发在研究预览阶段的具体支持状态,请以Anthropic官方文档为准)
- 无需本地机器运行:Routines在Anthropic自有的云基础设施上执行(来源:Anthropic官方博客,claude.com/blog/introducing-routines-in-claude-code),「即使用户关闭了笔记本电脑,Routines也会继续运行」——这是Anthropic官方的表述
这本质上是:AI能力 + 自动化调度 + MCP工具生态 = 可编程的AI工作流。
Anthropic在官方博客中用了一个很精准的比喻:Routines是「动态的cron job或短暂的、触发驱动的AI agent」(来源:Anthropic博客,claude.com/blog/introducing-routines-in-claude-code)。这个表述很重要——它明确区分了Routines和持续运行的AI Agent的边界:Routines是离散的、触发驱动的任务执行,而不是一个持续维护状态的长期Agent。这个设计决策意味着Routines在安全性和可预测性上比完全自主的Agent更容易管控。
Routines目前面向Claude Code Pro、Max、Team和Enterprise订阅用户开放(来源:SiliconANGLE 2026-04-14)。使用量会计入订阅者的使用额度,并有每日使用上限——这个设计说明Routines是功能性生产工具,不是演示功能。
用一个具体的例子来说明什么是可能的:
例子1:每日代码库健康检查
Routine: "每天早上8am,分析昨天所有的commit,生成一份代码质量报告:
- 新引入的技术债(magic numbers、重复代码、缺失测试)
- 安全相关的变更(依赖更新、权限变化)
- 影响核心业务逻辑的修改(附带上下文解释)
- 建议需要code review的重点PR"
触发: schedule (每天 08:00 UTC+8)
仓库: main-product-repo
MCP: GitHub MCP + Slack MCP (将报告发送到 #dev-team 频道)
例子2:PR自动预审
Routine: "当新PR创建时,自动执行:
- 检查测试覆盖率变化
- 识别潜在的breaking changes(API签名变更、数据库schema变更)
- 生成针对该PR的审查清单(reviewer应该重点看什么)
- 如果检测到安全相关变更,自动@安全团队"
触发: GitHub event (pull_request: opened)
仓库: target-repo
MCP: GitHub MCP + PagerDuty MCP
例子3:依赖安全扫描
Routine: "每周一检查所有npm/pip依赖的CVE更新,
生成一份需要升级的依赖清单,
自动创建相应的升级PR,
如果有Critical级别的CVE立即触发告警"
触发: schedule (每周一 06:00)
仓库: all-repos-in-org
MCP: GitHub MCP + Slack MCP + PagerDuty MCP
这些场景,以前需要:配置复杂的CI/CD流水线 + 编写自定义脚本 + 维护scheduler服务 + 集成通知系统。现在,理论上只需要用自然语言描述需求,Routines负责把它变成自动化的、可靠运行的工作流。
第三章:这背后的技术逻辑——Routines为什么可能是真的
Routines能够成立,依赖几个条件的同时满足:
条件一:AI可以可靠地理解和执行代码操作任务 这是Claude Code一直以来建立信誉的基础。SWE-bench等基准测试显示,Claude 3.7 Sonnet/Claude Code在软件工程任务上已经达到相当高的可靠性。「可以偶尔帮忙」和「可以自动化运行」之间有很大差距,但Claude Code过去一年的用户验证显示,对于定义清晰的工程任务,它的执行可靠性已经足够高。
条件二:MCP生态的成熟度 Routines的威力来自于MCP(Model Context Protocol)连接器——它能连接GitHub、Slack、PagerDuty、数据库、云服务API等外部系统。截至2026年4月,MCP生态系统已有大量公开服务器(据社区统计超过2000个),主流开发工具如Claude、Cursor、Windsurf、VS Code等已原生支持(来源:MCP GitHub仓库及社区统计数据,具体数字以Anthropic官方公告为准)。这个生态的成熟度,让Routines的「可接入的服务范围」已经覆盖了大多数企业技术栈的核心组件。
条件三:云端执行的可靠性 Routines在Anthropic云端运行,不依赖本地机器。这解决了自动化工作流最常见的故障点——本地机器断电/重启/网络问题导致scheduled任务失败。云端执行的前提是Anthropic自身的基础设施稳定性(参见今日已发的Claude中断SLA差距文章,这恰好是需要持续关注的风险点)。
条件四:安全性和权限控制 代码仓库操作需要谨慎的权限管理。目前Routines处于「研究预览」状态,说明Anthropic还在完善权限模型——什么样的操作需要人工确认、什么样的变更可以自动提交、如何防止AI在自动化执行中意外破坏代码库。这是产品走向生产就绪需要解决的最关键安全问题。
第四章:开发工具的竞争格局——Routines意味着什么
当前AI开发工具的竞争格局,大致分三个层次:
第一层:AI代码补全(GitHub Copilot, Cursor, Windsurf等) 这些工具在IDE内部提供实时代码建议。它们是AI开发工具最早成熟的形态,现在已经是标配——大多数开发者每天都在使用,但差异化越来越难,竞争正在向价格战方向演化。
第二层:AI编程助手(Claude Code, ChatGPT Code Interpreter, Gemini Code Assist等) 这是「对话式写代码」的形态——可以说「帮我重构这个函数」、「帮我调这个bug」、「帮我写一个新功能」。Claude Code目前在这个层次竞争,并且已经建立了相当强的用户口碑。
第三层:自主Agent和自动化工作流(还处于早期阶段) 这是「AI自主完成开发任务」的形态,不需要开发者每次手动触发。目前这个层次的产品还很少,Claude Code的Routines是最接近这个形态的公开产品之一。
Anthropic通过Claude Code的重构,是在从第二层向第三层扩张:既保留了对话式编程助手的功能(大幅改善的多会话工作区),又引入了自动化调度的能力(Routines)。
这个「向上扩张」的战略意义在于:第三层是目前竞争最少、价值最高、粘性最强的层次。如果一个企业的代码库已经被Claude Code的Routines深度集成(每天自动跑health check、每个PR自动生成review、每周自动扫描安全漏洞),那么这个企业切换到竞争对手的成本会极高——不只是切换费用,而是要重新设置所有的自动化工作流。
第五章:三层洞察——这次更新背后说明了什么
洞察一:AI助手正在进化为AI基础设施
Claude Code的Routines,本质上是在把AI能力从「工具(tool)」升级为「基础设施(infrastructure)」。
工具的特征是:你主动去用它,它帮你完成一件事。基础设施的特征是:它持续在后台运行,保障各种系统的正常工作,你不用每次都主动触发它。
Routines让Claude Code开始具备「基础设施」的属性——按计划运行、事件触发、无需人工干预、深度嵌入技术栈。这是一个质的跃迁,不只是「更好用的工具」。
洞察二:MCP正在成为AI时代的「HTTP协议」
Routines的威力,50%来自Claude Code自身的能力,另50%来自MCP连接器的生态。这个设计揭示了Anthropic对AI工具集成问题的根本解决方案:不是自己实现所有集成,而是定义一个标准协议(MCP),让所有外部系统自己来接入。
这个逻辑与HTTP协议的意义类似:HTTP不是某种具体功能,而是定义了「浏览器和服务器如何通信」的规范。一旦这个规范被广泛采用,整个互联网生态就在这个规范上构建起来了。MCP的野心是类似的:定义「AI模型和外部工具如何通信」的标准,让整个工具生态在这个标准上构建。
如果MCP成为真正的行业标准,那么Anthropic不只是赢了「AI编程助手」这个产品竞争,而是掌握了AI工具集成的底层协议——这是平台级的价值,而不只是产品级的竞争优势。
洞察三:「研究预览」是刻意的,而不是「还没做好」
Claude Code Routines目前是「研究预览」(Research Preview)状态,不是GA(Generally Available)。很多人可能认为这意味着功能还不稳定,是「还没做完」的状态。
但研究预览更准确的含义是:功能已经可用,但Anthropic还在收集真实使用数据,来确定哪些场景的可靠性符合生产标准、哪些还需要额外的安全护栏。对于自动执行代码操作的功能,「先在受控环境下收集数据,再逐步开放生产权限」是正确的产品策略。
预期时间线:如果Routines是Anthropic的战略重点(从重构的规模来看显然是),那么3-6个月内进入正式GA状态,12个月内成为企业标准配置,是合理的预测。
第六章:对开发者和技术管理者的实际建议
对个人开发者
现在就开始熟悉Claude Code的多会话工作区功能,特别是SSH会话和内置终端。这些是近期GA的功能,直接使用不需要等待。
对于Routines,在研究预览期的合理方式是:
- 先在非关键项目上实验
- 从「只读操作」开始(生成报告/分析变更),不要直接配置自动写代码提交
- 建立对AI自动化结果的review习惯,而不是完全依赖自动化
对技术负责人
Routines代表的「AI自动化工作流」趋势值得认真纳入技术栈规划。但引入之前,需要回答几个关键问题:
- 当Routines执行出错,谁来负责?(权责划分)
- 如何在不过度信任AI的情况下,获得自动化的效率收益?(人机协作边界)
- Routines产生的操作如何纳入现有的代码审计和合规流程?(监管合规)
这些问题没有统一答案,但提前规划比被动应对更好。
第七章:与竞争对手的比较
在AI开发工具的自动化方向,Anthropic并不是唯一的参与者,但各家的路径有显著差异:
Cursor的路径 Cursor是目前在IDE级别最受开发者欢迎的AI编程工具之一,它深度嵌入到VS Code的工作流中,提供优秀的上下文感知代码补全和对话式编程。但Cursor目前的重心还在「会话级别」——你主动对话,AI帮你完成当前会话的任务。Cursor还没有等价于Routines的自动化调度功能。
GitHub Copilot Workspace的路径 GitHub在2024年推出Copilot Workspace,允许用户用自然语言描述一个功能需求,Copilot自动生成实现计划、代码变更和测试,用户最终审核并合并。这个方向与Routines的「任务自动化」有重叠,但目标场景不同——Copilot Workspace是「从需求到实现」的单次任务自动化;Routines是「周期性运行的后台维护」自动化。
Devin/SWE-agent路径 Devin(Cognition Lab)等「软件工程Agent」产品致力于让AI完全自主完成软件工程任务,包括自主浏览文档、写代码、调试、部署。这是最激进的「全自动化」方向,但当前阶段的可靠性和成本还限制了它的实际企业级应用。
Anthropic的Claude Code Routines选择了一个中间路径:用户定义任务(Prompt + 触发条件),AI自动执行,人工审核结果。这比「AI全自主」更保守,比「每次手动触发」更自动。这个中间路径在当前AI可靠性水平下,可能是能在企业环境中真实落地的最优点。
第八章:关于「研究预览」的深层逻辑
Claude Code Routines是「研究预览」状态,背后有一个很重要的产品逻辑值得展开讨论。
为什么不直接GA?
对于任何自动执行代码操作的系统,最大的安全风险是「AI在没有人类监督的情况下做了不应该做的事」。可能的场景包括:
- Routine在执行中误删了重要文件
- Routine生成的代码变更引入了安全漏洞,并自动提交到主干
- Routine因为误解了触发条件,在错误的时间执行了大量操作
- Routine调用MCP连接器时意外触发了外部系统的生产操作
这些风险的共同特征是:错误一旦自动化,影响范围会比手动操作时大得多。手动操作的错误通常是「我这次写错了」;自动化的错误可能是「它每天凌晨3点都错了,我三周后才发现」。
「研究预览」的用意是:让早期采用者在受控范围内测试这些边界,帮助Anthropic建立「什么操作类型在什么场景下是安全的」的数据集,然后用这些数据来设计权限系统和安全护栏。
这是负责任的产品发布方式,特别对于有代码操作权限的自动化工具而言。
对企业用户的实际建议
如果你正在评估是否在团队中引入Claude Code Routines的测试,以下是一个可行的渐进策略:
(以下为作者基于产品特性的使用建议,非Anthropic官方指导)
阶段一(研究预览期可尝试):只读观察
- 配置Routines只生成报告,不执行任何写操作
- 比如:每天生成代码质量报告,发送到Slack频道
- 观察AI的分析质量和触发可靠性,建立信任基础
阶段二(待正式GA后):受控写操作
- 在测试分支上允许Routines自动创建PR(不允许直接推主干)
- 每个自动生成的PR都需要人工review再合并
- 建立对AI代码质量的判断基准
阶段三(功能稳定成熟后):生产级自动化
- 对特定类型的变更(依赖版本升级、lint修复、测试覆盖率补全)允许自动合并
- 建立完整的告警和回滚机制
- 纳入正式的代码审计流程
结语
Claude Code从聊天助手到多Agent工作区再到自动化Routines的演化,展示了一个AI产品的正确成熟路径:先解决「能用」的问题,再解决「好用」的问题,最后解决「不用主动管、它自己能用」的问题。
第三步——「它自己能用」——才是AI真正嵌入企业技术基础设施、从工具变成基础设施的关键跃迁。Claude Code Routines是否能实现这个跃迁,取决于在研究预览阶段收集到的可靠性和安全数据。
但Anthropic已经表明了方向:他们不只是在做一个「更好的代码助手」,而是在定义「AI时代的开发环境应该是什么形态」。
这是一场更大的竞争,而这次重构是向那个终点又迈出了一大步。
参考资料
- Anthropic’s Claude Code Gets Automated Routines, Desktop Makeover — SiliconANGLE, 2026-04-14, https://siliconangle.com/2026/04/14/anthropics-claude-code-gets-automated-routines-desktop-makeover/
- MCP生态数据 — 基于公开信息整理(2026年4月)
- Anthropic Claude Code官方文档 — docs.anthropic.com(公开文档)