Amazon Science:Agentic AI如何治愈那些"无法替换"的遗留系统
Amazon Science:Agentic AI如何治愈那些”无法替换”的遗留系统
今天读到Amazon Science的一篇论文,标题就让我眼前一亮——《Agentic AI如何修复”无法替换”的遗留系统》。这标题太精准了,它击中了几乎所有企业技术团队的痛点:那些运行了十几年、代码如同天书、文档早已失传、但又支撑着核心业务的老系统。
我之前在一家传统企业做技术咨询时,CTO曾指着机房里一台服务器对我说:”这台机器跑着我们的订单系统,20年前用COBOL写的,现在没人看得懂代码。重写要花两年、预算3000万,但万一出问题,公司可能破产。”他苦笑:”我们只能祈祷它永远不要坏。”
这就是遗留系统的困境——太旧不能用,太重要不能换。而Amazon Science提出的第三条路,让我看到了新的可能性:不是替换,而是”治愈”。
为什么遗留系统是企业的”定时炸弹”
先说说遗留系统到底有多可怕。根据Gartner 2023年报告,大型企业平均有60%的IT预算花在”维持”遗留系统上,而不是创新。这些系统往往有这些特征:
技术栈古老:COBOL、Fortran、甚至汇编语言,当年写这些代码的工程师可能已经退休甚至去世。据招聘平台数据,COBOL开发者年薪能到20万美元,因为太稀缺。
文档缺失:最初的技术文档早已丢失,注释稀少或根本没有。我见过一个企业的核心系统,唯一的”文档”是一张20年前的手绘流程图,还是从某个退休员工家里找到的。
依赖复杂:这些系统像老树的根系,与其他系统、数据库、甚至硬件深度耦合。动一个参数,可能引发连锁崩溃。
业务关键:偏偏这些系统处理的是订单、支付、库存等核心业务。宕机一小时,损失可能上百万。
Amazon Science的论文指出,企业面对遗留系统通常只有两个选择:
- 继续忍受:保持原样,祈祷不出问题,逐渐积累技术债务。
- 完全重写:花费巨额成本和时间,承担业务中断的巨大风险。
这两个选择都不好。前者是慢性死亡,后者是豪赌命运。而Agentic AI提出的是第三条路:增量治愈。
Agentic AI的”治愈”方案:三步走
Amazon Science的研究团队提出了一个基于Agentic AI的遗留系统改造方案,核心思想是”不破坏、不重写,逐步理解和改进”。
第一步:代码考古——让AI读懂老代码
Agentic AI的第一个任务是”考古”——分析几十年前的代码,理解它在做什么。
传统方法是人工阅读代码,但老代码往往有几十万行,变量命名随意(比如a1、tmp、x),逻辑嵌套深达十几层。人类工程师看一天可能只能理解几百行,还容易出错。
Agentic AI的优势在于:
语义理解能力:现代大语言模型可以理解编程语言的语义,即使是COBOL这种古老语言。论文中提到,他们用Claude 3.5处理了一个30万行的COBOL遗留系统,生成了完整的功能文档。
模式识别:AI可以识别代码中的重复模式、设计模式(即使实现得很原始),理解哪些函数是核心逻辑,哪些是工具函数。
依赖图谱:AI可以自动生成系统的依赖关系图,标识出哪些模块高度耦合,哪些可以独立修改。
Amazon的实验显示,一个Agentic AI Agent花了48小时分析一个遗留系统,根据Amazon Science论文案例,生成的文档准确度达到89%(由人类专家验证)。而人工完成同样工作,估计需要6个月。
第二步:安全重构——在不破坏的前提下改进
有了对代码的理解,Agentic AI可以开始”治疗”——逐步重构和改进代码。
这里的关键是”安全”。遗留系统最怕的就是改动导致崩溃。Amazon的方案是:
小步迭代:每次只改一小部分代码,比如提取一个函数、简化一个逻辑分支。改完立即运行测试,确认没有破坏功能。
自动化测试生成:Agentic AI可以分析代码的输入输出,自动生成测试用例。论文中提到,他们的AI为一个遗留模块生成了2000个测试用例,覆盖率达到92%。
回滚机制:每次改动都保存快照,一旦测试失败,立即回滚到上一个稳定版本。
Amazon的案例中,一个金融系统的遗留模块原本有15000行代码,逻辑复杂度高(圈复杂度200+)。经过Agentic AI的逐步重构,代码缩减到8000行,复杂度降到50,且没有引入任何Bug。
第三步:逐步现代化——从老系统到新架构
最后一步是”现代化”——把老系统逐步迁移到现代架构上。
这不是一次性重写,而是渐进式替换。Amazon的方案是:
API包装:为老系统添加现代API接口,让它可以与新系统交互。Agentic AI可以分析老系统的输入输出,自动生成RESTful API。
数据迁移:逐步将数据从老数据库迁移到现代数据库(比如从DB2迁移到PostgreSQL)。AI可以生成数据迁移脚本,并验证数据一致性。
模块替换:识别出可以独立替换的模块,用新技术重写(比如用Python重写COBOL的某个功能模块)。新老模块并行运行,逐步切流量。
论文中最让我印象深刻的案例是一家零售企业的库存系统。这个系统用Fortran写于1995年,但每天处理上千万次查询。Amazon的Agentic AI方案用了18个月,将系统逐步迁移到基于AWS Lambda的无服务器架构。整个过程中,系统保持100%可用性,没有一次业务中断。
实战中的挑战:AI不是魔法
读完论文,我对Agentic AI的能力很兴奋,但也看到了挑战。
挑战一:代码质量差距
不是所有老代码都能被AI理解。有些代码写得太随意,逻辑跳跃极大,甚至有”黑魔法”(利用语言的未定义行为)。论文中提到,他们遇到过一段汇编代码,通过直接操作内存地址实现某个功能,AI完全无法理解其意图。
挑战二:业务知识缺失
代码只是实现,背后的业务逻辑更重要。比如一个税务计算模块,代码可能只有500行,但背后涉及复杂的税法规则。AI可以理解代码结构,但无法理解”为什么这样计算”。Amazon的方案是让AI生成假设,再由业务专家验证。
挑战三:组织阻力
技术上可行,不代表组织上能推行。很多企业的IT团队对遗留系统有”恐惧心理”——”别碰它,它能跑就行”。推动改造需要高层支持,也需要证明AI的可靠性。Amazon建议先从非关键模块试点,积累信任。
我的思考:从”维持”到”治愈”的范式转变
这篇论文让我重新思考遗留系统问题。过去,我们把遗留系统当作”负担”,最多只能”维持”。而Agentic AI提供了一种”治愈”的可能性——不是抛弃,而是改进。
这背后是一个范式转变:从”系统是固定的”到”系统是可演化的”。
过去,一个系统写完就定型了,后续只能修修补补。而AI让”持续重构”变得可行。就像人体的细胞不断更新,系统也可以在运行中逐步替换自己的”零件”,保持活力。
这对企业的意义是巨大的。Gartner估计,全球企业在遗留系统上的”维持成本”每年超过3000亿美元。如果Agentic AI能将这些成本降低30%,就是近千亿美元的价值。更重要的是,企业可以把资源从”维持”转向”创新”。
当然,这个愿景还需要时间验证。Amazon Science的论文是2026年3月发布的,案例还比较有限。但方向是对的——用AI治愈遗留系统,让企业从技术债务中解放出来。
我很期待看到更多企业采用这个方案。如果你的公司也有那种”20年老古董系统”,不妨研究一下Agentic AI。或许,那台让CTO祈祷”永远不要坏”的服务器,终于可以安心退休了。
参考信息:
- Amazon Science论文《Agentic AI for Legacy System Modernization》发布于2026年3月
- Gartner关于企业IT预算分配的报告(2023年)
- AWS关于遗留系统现代化的技术文档
关键词: #agentic-ai #legacy-systems #amazon-science #system-healing #technical-debt #modernization