「AI Agent 企业落地指南」系列第 5 篇(收官篇)——前四篇我们从技术架构到安全治理,逐层拆解了 Agent 进入企业的技术路径。这一篇,我们要直面一个所有人心知肚明却很少有人愿意戳破的现实:大多数企业不缺 Agent 技术,缺的是组织准备度。

一、最热赛道上最冷的现实

29,000。

这是 Salesforce 最新财报披露的 Agentforce 交易数。自 2024 年 Dreamforce 大会以来,这家全球最大的企业级软件公司围绕 Agent 进行了一次历史性的战略转向,数字看起来令人振奋。

但把这个数字放进分母,画面就变了。Salesforce 全球客户超过 15 万家。29,000 笔交易中,相当一部分并非付费合同,而是”探索性试点”。用 Salesforce 前沿部署工程(FDE)团队负责人 Jennifer Cramer 的话说:”我们的很多客户,试点就是他们 Agent 旅程走到的最远处。”

Agentic AI 正处于一个”尴尬的成长期”——技术已经足够成熟到让 Demo 惊艳四座,却还不够成熟到让企业放心把它接入生产系统。

这不是 Salesforce 一家的问题。Workday 用 11 亿美元收购了 Sana,拿出了 300 多个预建技能,结果发现最大的挑战不是功能不够,而是客户不知道从哪里开始。SAP 引用 IDC 数据称 Agent 驱动的应用可以带来 37% 的效率提升和 39% 的成本优化,但前提是企业通过四维就绪评估。ServiceNow 的 CEO Bill McDermott 甚至发出了更尖锐的警告:如果 Agent 的落地速度继续加快而组织转型跟不上,Z 世代的失业率可能从当前的 9% 飙升到 30%。

最热的赛道,最冷的现实。Agent 的”尴尬期”不在技术里——它在组织的骨髓里。

二、Demo 容易,生产难:三座翻不过的山

每一个看过 Agent Demo 的企业决策者都会有同一个反应:太棒了,我们也要。但从 Demo 到生产,中间隔着三座真实的大山。

第一座山:数据质量。 Agent 不是人类,没有”将就着用”的能力。一个客服代表可以在数据不完整的情况下靠经验和直觉处理工单,Agent 不行。Salesforce FDE 团队发现,大量客户卡在”数据分析瘫痪”中——他们以为必须先把所有数据清洗干净才能开始部署 Agent。”很多客户会陷入分析瘫痪,因为他们觉得必须一次性清理所有数据,一切都必须完美。”Cramer 坦言。SAP 的四维就绪框架把这一点放在了第一位:数据质量和可访问性是 Agent 决策的基础,数据孤岛、过时数据或缺失上下文都会拖慢部署并带来糟糕的结果。

第二座山:流程适配。 SAP 说得很直白——”自动化混乱只会创造更快的混乱”。Agent 在定义清晰的工作流上如鱼得水,但在大多数企业里,所谓的”标准流程”不过是 PPT 上的方框和箭头,实际操作中充满了例外、人情和暗箱操作。当你试图让 Agent 接手一个采购审批流程,才会发现真正的流程和文档上写的完全是两回事。Workday 产品与技术总裁 Gerrit Kazmaier 说得精确:”在企业里,差不多对等于错。发工资,你最好 100% 准确。关账,你最好 100% 准确。”概率性的 AI 推理引擎必须被放在确定性的企业轨道上运行,而这条轨道的铺设远比模型本身困难。

第三座山:组织变革。 这是最高的一座。Agent 不只是一个新工具,它是一种新的工作方式。当一个 Agent 可以在两周内接手航班取消处理(如 Engine 的案例),原来负责这项工作的人怎么办?当 Sana 把 24 个跨越 6 个系统的手动任务压缩成一次对话,那些在 6 个系统之间来回切换的员工何去何从?Workday 联合创始人 Aneel Bhusri 没有回避这个问题:”大量低层级的人力资源工作会被 Agent 取代,这是不可避免的。我们必须找到一个办法来安置因 AI 而被取代的员工。”

三座大山叠在一起,构成了 Agent 落地的真正鸿沟。Demo 阶段,你只需要一个干净的数据集、一条打磨过的流程和一群兴奋的技术团队。生产阶段,你需要面对的是十年未清理过的数据湖、一百种”特殊情况”的审批流程,以及一群对 AI 既好奇又恐惧的员工。

三、Salesforce 的”白手套”模式:为什么最大的 Agent 平台要派人上门

如果 Agent 真的像 Demo 里展示的那样即插即用,Salesforce 为什么要组建一支专门的”前沿部署工程师”(FDE)团队,以三人小组的形式上门给客户手把手做陪伴?

答案在于 Agent 落地的本质不是技术部署,而是组织转型。

FDE 团队的构成耐人寻味——它不是传统的实施顾问团队,也不是普通的技术支持。Cramer 这样描述:”他们是一种新型的混合体,兼具咨询师的外交手腕和深度软件工程师的技术功底。”每个小组三人,混合了资深技术专家和年轻工程师,既能和 CTO 谈战略,也能卷起袖子写代码。

更关键的是 FDE 的工作模式。他们不是替客户做完就走的外包,而是”肩并肩”的共建者。”有时候他们在建,我们在旁边;有时候我们在建,他们在旁边。但最终我们离开时,他们拥有了自己继续前进的技能和经验。”这套”白手套”模式本质上是在做知识转移和组织能力建设。

FDE 团队观察到一个明显的客户演化轨迹。早期,客户卡住的原因往往不是技术——而是”不知道从哪里开始”。每家企业都感受到了必须用 AI 转型的压力,但具体怎么做、先做什么、做多大,完全没有概念。”帮我建一个路线图,帮我理解我的用例,帮我排优先级”——这才是客户最初真正需要的。

成功案例印证了一条通用法则:从小处开始,从具体问题开始。交通和酒店服务商 Engine 的做法堪称教科书——它没有试图”煮沸整个海洋”,而是锁定了一个具体痛点:航班取消处理。两周部署,效果立竿见影。然后才在此基础上扩展更多能力。零售商 Williams Sonoma 的路径类似:先在 Pottery Barn Kids 这一个品牌上跑通,然后在 8 个品牌上做”冲洗-重复”式渐进推广。

这些案例的共同点不是技术多强,而是组织策略多聪明——缩小范围、降低风险、快速验证、渐进扩展。Agent 落地的最佳实践,本质上是变革管理的最佳实践。

四、Workday 收购 Sana 的启示:垂直碾压通用

如果说 Salesforce 的 FDE 模式揭示了 Agent 落地的”怎么做”,Workday 用 11 亿美元收购 Sana 则回答了一个更根本的问题:企业应该选择什么样的 Agent?

答案是:垂直的,而不是通用的。

最能说明问题的不是 Sana 的 300 多个预建技能,不是它能把 24 项跨越 6 个系统的手动任务压缩成一次对话,甚至不是它在 Workday 的 HR 和财务系统中的深度集成。最能说明问题的是一个客户案例:Sana 客户 Berner 在部署后仅 40 天就达到了 90% 的员工采纳率,并退掉了此前购买的 400 个 ChatGPT 企业版许可证。

退掉 400 个 ChatGPT 许可证——这个动作值得反复咀嚼。

它意味着企业在实际使用后做出了一个判断:通用型 AI 助手在企业场景中的价值上限,远低于一个深度集成到业务系统中的垂直 Agent。ChatGPT 可以帮你写邮件、做摘要、回答问题,但它不能帮你在 Workday 里提交医疗休假申请、在 ServiceNow 里开通软件权限、在 Salesforce 里更新客户记录——因为它没有这些系统的写入权限和业务上下文。

Sana 的架构设计精准击中了这个痛点。它的连接器不是只读的——它们能向第三方应用写入操作。当你对 Sana 说”帮我报销上周出差费用”,它会扫描邮箱找收据、对照公司政策检查合规性、标记不合规项目、在 Workday 里提交报销单。24 个手动步骤变成一次对话。

Workday 的定价模式也值得关注。它采用 Flex Credits 体系——每个客户根据规模获得年度免费配额,每个信用值 0.10 美元,不同的 AI 能力以不同速率消耗信用。用完了可以按订阅方式购买更多。这种从”按座席收费”到”按成果收费”的转变,标志着企业软件经济学的根本性重构。

更深层的启示:Agent 的竞争不在模型层面,而在业务集成深度。Sana 使用多个底层模型,为每个任务选择精度最高、成本最优的方案,有的操作跨多个模型做多层调用。模型是可替换的商品,业务上下文才是护城河。

五、SAP 的四维就绪框架:企业自查清单

如果前面的案例让你跃跃欲试,SAP 的四维就绪框架应该先泼一盆冷水——或者说,递给你一面镜子。

SAP 在其 Joule AI Agent 框架中提出了企业部署前必须通过的四维评估。根据 IDC 的研究数据,通过评估并采用 AI 驱动套件的企业确实获得了显著收益:37% 的流程生产力提升、39% 的成本优化、36% 的劳动力生产力提升、35% 的上市速度加快。但这些数字有个前提——企业必须具备以下四个维度的就绪度。

维度一:数据质量与可访问性。 Agent 的决策质量取决于数据质量。清洁、结构化、实时的跨企业数据是有效决策的基础。数据孤岛、过时数据或上下文缺失都会拖慢采纳并带来差劲的结果。这不是一次性的清洗工作,而是持续的数据治理能力。

维度二:流程成熟度。 Agent 在定义良好的工作流上表现最佳。在自动化之前,企业必须确保业务流程已经标准化、文档化,并准备好被编排。自动化混乱只会创造更快的混乱。

维度三:组织清晰度。 谁来使用这些 Agent?用于什么任务?Agent 如何交接给人类员工?清晰的角色定义和沟通对于采纳和信任至关重要。这不是 IT 部门能独自回答的问题,它需要业务部门、HR 和管理层的共同参与。

维度四:治理与护栏。 就像人类员工一样,AI Agent 需要规则。定义权限、升级路径、伦理边界和审计实践。Agent 应该自主行动,但必须在企业设定的边界内运行。

把这四个维度当作一份自查清单,诚实地给自己的企业打分。如果有两个维度以上拿不到 60 分,你的 Agent 计划可能还不到启动的时候——或者说,你需要先投资的不是 Agent 技术,而是组织基础设施。

六、Agent 经济学:ROI 如何算

Agent 的成本模型正在经历从”按人头算”到”按结果算”的范式转换。理解这个转换对于正确评估 Agent 投资至关重要。

当前市场上主要存在三种定价模式:

按座席计费(Per-Seat): 传统模式的延续。每月每用户固定费用。但在 Agent 场景下存在根本矛盾——Agent 的价值在于减少使用软件的人数,而按座席收费的逻辑是用户越多收入越高。

按任务计费(Per-Task): Moltify 等平台采用的模式。合同审核 15 到 50 美元一份,代码安全审计 30 到 100 美元一次。企业月费从几百美元到数万美元不等。

按成果计费(Outcome-Based): Workday 的 Flex Credits 模式——不按用户数计费,而按 Agent 完成的工作量计费。这种模式最贴合 Agent 的价值逻辑。

AWS 的 Transform 案例提供了量化参考。新西兰最大电力和天然气分销商 Vector Limited 使用 Agent AI 进行云迁移:速度提升 34%,五年总拥有成本降低 35%,60% 的波次规划自动化。以 1800 台生产服务器的假设场景测算,AI 驱动的迁移将总变更成本从 768 万美元降至 482 万美元,五年 ROI 从 22% 跃升至 81%。

Workday 的 NetApp 案例提供了另一个视角:合同智能 Agent 分析 90,000 份采购合同,节省 250 万美元。没有任何企业会雇佣几百名律师手动审查这些合同——AI 改变的不是”做同样的事花更少的钱”,而是”让以前经济上不可行的事情变得可行”。Kazmaier 说得精确:”更大的机会不在效率提升,而在于利用推理单位经济的变化,完成今天所有未完成的工作。”

计算你自己的 Agent ROI 时,应该考虑三层价值:

  1. 替代价值——Agent 做了原来人做的事,节省了多少人力成本?
  2. 增量价值——Agent 做了原来根本没人做的事,创造了多少新价值?
  3. 速度价值——Agent 把原来需要数周的事压缩到数小时,时间差带来了多少机会成本的节省?

大多数企业只算第一层,导致 ROI 被严重低估。真正的价值在第二层和第三层。

七、系列收官:五篇文章的核心地图

回顾这个系列的五篇文章,我们实际上画出了一张 Agent 企业落地的完整地图。

第一篇「Harness Engineering 取代 Prompt Engineering」 确立了核心认知:Agent 的性能瓶颈不在 Prompt,而在外骨骼——检索、工具调用和结构化验证构成的 Harness 层。

第二篇「四大巨头定义企业 Agent 的正确打开方式」 描绘了架构共识:Salesforce、Oracle、ServiceNow、SAP 收敛到”套件集成 + Agent 编排”的模式。

第三篇「AI Agent 安全与治理」 划出了红线:权限控制、提示注入防护、审计追踪——这些不是锦上添花,而是上线的入场券。

第四篇拆解了 Agent 的成本经济学——从 Flex Credits 到 Per-Task 定价,新的经济模型正在重塑企业对 AI 投资的核算方式。

本篇(第五篇) 则把镜头从技术拉回到组织:Agent 落地最大的瓶颈不是模型、不是架构、不是安全——而是组织本身。

五篇文章串起来,核心洞察可以浓缩为一句话:Agent 是一面镜子,照出的不是 AI 的能力边界,而是企业自身的组织成熟度。

八、第三层洞察:组织的”免疫系统”

本篇到这里,所有的案例和框架都指向一个更深层的结论——Agent 落地的最大阻力不是技术,而是企业的”组织免疫系统”。

什么是组织的免疫系统?就是企业在多年运营中形成的一套自我保护机制:现有流程、KPI 体系、权力结构、预算分配逻辑、部门边界和晋升路径。这套系统的核心功能是维持稳定,排斥一切可能打破现有平衡的异物——而 Agent 正是这样的异物。

想象一下:你在客服部门部署了一个 Agent,两周内它学会了处理 80% 的常规工单。客服主管的 KPI 是”管理团队规模”和”招聘效率”——Agent 越好用,他的团队越小,KPI 越难看。他有一百种方式让部署”遇到困难”——数据接口审批拖延、内部测试不断发现”边缘场景”、合规部门要求补充评估……技术上没有一个步骤是错的,但组织免疫系统正在安静而高效地排斥入侵者。

这就是为什么 Salesforce 需要 FDE 团队——不只是为了解决技术问题,更是为了在组织内部建立 Agent 的”盟友网络”。这也是为什么 Workday 选择从 HR 和财务这种高度标准化的领域切入——因为这些领域的流程相对固定,组织免疫反应最弱。这更是为什么 SAP 把”组织清晰度”列为四维评估的第三维——因为如果没有自上而下的组织共识,再好的技术也会被组织抗体吞噬。

Agent 的落地是一场组织手术。你不能只给病人一把手术刀——你需要外科医生(技术团队)、麻醉师(变革管理)、护理团队(培训体系),和最关键的,病人的配合意愿(管理层的真正承诺,不是 PPT 上的”战略优先级”)。

九、写在最后:Agent 时代的清醒剂

Bhusri 考察那些新建的初创公司,发现过去需要 500 人的事情现在 150 人就能做。Sana 创始人 Hellermark 说 100% 的工程师在使用 AI 辅助编程,80%–90% 的代码由 AI 辅助完成——但他们仍在尽可能多地招聘工程师。

这两个事实放在一起,描绘出 Agent 时代的真实图景:不是人被替代,而是人的角色被重新定义。Agent 不是来抢工作的,它是来抢借口的——”数据太多处理不过来”“流程太复杂没法改”“人手不够做不了”——当 Agent 拿走了这些借口,暴露出来的是组织本身的惰性。

对于正在观望的企业,这里有三条务实的建议:

第一,不要等数据完美了再开始。 Engine 的案例证明,锁定一个具体问题、使用一组具体数据、两周内跑出结果,远比花六个月做”数据治理整体方案”更有效。完美是投产的敌人。

第二,不要买通用 Agent,要买垂直 Agent。 Berner 退掉 400 个 ChatGPT 许可证的故事已经说得很清楚:在企业场景中,一个深度集成到业务系统中、拥有写入权限和业务上下文的垂直 Agent,价值远超一个什么都能聊一点但什么都做不了的通用助手。

第三,也是最重要的,先改组织再上 Agent。 或者至少,同步改。用 SAP 的四维框架做一次诚实的自查,看看你的数据、流程、组织和治理是否真的准备好了。如果没有,Agent 的落地只会照出更多的问题——然后被组织免疫系统悄悄杀死。

29,000 笔 Agentforce 交易中,绝大多数还在试点阶段。这个数字不是失败的证据——它是清醒的起点。从 Demo 到生产的鸿沟,填不满它的是更好的模型或更多的功能,而是更成熟的组织、更清晰的流程、和更诚实的自我认知。

Agent 时代真正的竞争力不在于你用了多先进的 AI,而在于你的组织能多快地学会和 AI 一起进化。


本文是「AI Agent 企业落地指南」系列的第 5 篇(收官篇)。整个系列从 Harness Engineering 的技术基本功出发,经过企业架构设计、安全治理红线和成本经济学分析,最终回到了所有技术变革的原点——人和组织。感谢你一路读到这里。


参考资料

  1. Jennifer Cramer on Salesforce Forward Deployed Engineering: Agentic AI hits ‘a difficult age’ — diginomica, 2026
  2. Workday acquires Sana for $1.1B: 300+ AI Skills, 24 Tasks Collapsed Into a Conversation — iTWire, 2026
  3. SAP Joule AI Agent Readiness Framework: The Suite Spot: A Practical Guide to Business AI Agents — GNN Liberia / African Media Agency, 2026
  4. AWS Transform Agentic AI Migration: Accelerating Cloud Migration with AWS Transform and Generative AI — AWS Blog, 2026
  5. AI Agent Pricing Guide: How Much Does an AI Agent Cost? — Moltify, 2026