Agent 落地的"尴尬期"——从 Demo 到生产的真实鸿沟

「AI Agent 企业落地指南」系列第 5 篇（收官篇）——前四篇我们从技术架构到安全治理，逐层拆解了 Agent 进入企业的技术路径。这一篇，我们要直面一个所有人心知肚明却很少有人愿意戳破的现实：大多数企业不缺 Agent 技术，缺的是组织准备度。

一、最热赛道上最冷的现实

29,000。

这是 Salesforce 最新财报披露的 Agentforce 交易数。自 2024 年 Dreamforce 大会以来，这家全球最大的企业级软件公司围绕 Agent 进行了一次历史性的战略转向，数字看起来令人振奋。

但把这个数字放进分母，画面就变了。Salesforce 全球客户超过 15 万家。29,000 笔交易中，相当一部分并非付费合同，而是”探索性试点”。用 Salesforce 前沿部署工程（FDE）团队负责人 Jennifer Cramer 的话说：”我们的很多客户，试点就是他们 Agent 旅程走到的最远处。”

Agentic AI 正处于一个”尴尬的成长期”——技术已经足够成熟到让 Demo 惊艳四座，却还不够成熟到让企业放心把它接入生产系统。

这不是 Salesforce 一家的问题。Workday 用 11 亿美元收购了 Sana，拿出了 300 多个预建技能，结果发现最大的挑战不是功能不够，而是客户不知道从哪里开始。SAP 引用 IDC 数据称 Agent 驱动的应用可以带来 37% 的效率提升和 39% 的成本优化，但前提是企业通过四维就绪评估。ServiceNow 的 CEO Bill McDermott 甚至发出了更尖锐的警告：如果 Agent 的落地速度继续加快而组织转型跟不上，Z 世代的失业率可能从当前的 9% 飙升到 30%。

最热的赛道，最冷的现实。Agent 的”尴尬期”不在技术里——它在组织的骨髓里。

二、Demo 容易，生产难：三座翻不过的山

每一个看过 Agent Demo 的企业决策者都会有同一个反应：太棒了，我们也要。但从 Demo 到生产，中间隔着三座真实的大山。

第一座山：数据质量。 Agent 不是人类，没有”将就着用”的能力。一个客服代表可以在数据不完整的情况下靠经验和直觉处理工单，Agent 不行。Salesforce FDE 团队发现，大量客户卡在”数据分析瘫痪”中——他们以为必须先把所有数据清洗干净才能开始部署 Agent。”很多客户会陷入分析瘫痪，因为他们觉得必须一次性清理所有数据，一切都必须完美。”Cramer 坦言。SAP 的四维就绪框架把这一点放在了第一位：数据质量和可访问性是 Agent 决策的基础，数据孤岛、过时数据或缺失上下文都会拖慢部署并带来糟糕的结果。

第二座山：流程适配。 SAP 说得很直白——”自动化混乱只会创造更快的混乱”。Agent 在定义清晰的工作流上如鱼得水，但在大多数企业里，所谓的”标准流程”不过是 PPT 上的方框和箭头，实际操作中充满了例外、人情和暗箱操作。当你试图让 Agent 接手一个采购审批流程，才会发现真正的流程和文档上写的完全是两回事。Workday 产品与技术总裁 Gerrit Kazmaier 说得精确：”在企业里，差不多对等于错。发工资，你最好 100% 准确。关账，你最好 100% 准确。”概率性的 AI 推理引擎必须被放在确定性的企业轨道上运行，而这条轨道的铺设远比模型本身困难。

第三座山：组织变革。 这是最高的一座。Agent 不只是一个新工具，它是一种新的工作方式。当一个 Agent 可以在两周内接手航班取消处理（如 Engine 的案例），原来负责这项工作的人怎么办？当 Sana 把 24 个跨越 6 个系统的手动任务压缩成一次对话，那些在 6 个系统之间来回切换的员工何去何从？Workday 联合创始人 Aneel Bhusri 没有回避这个问题：”大量低层级的人力资源工作会被 Agent 取代，这是不可避免的。我们必须找到一个办法来安置因 AI 而被取代的员工。”

三座大山叠在一起，构成了 Agent 落地的真正鸿沟。Demo 阶段，你只需要一个干净的数据集、一条打磨过的流程和一群兴奋的技术团队。生产阶段，你需要面对的是十年未清理过的数据湖、一百种”特殊情况”的审批流程，以及一群对 AI 既好奇又恐惧的员工。

三、Salesforce 的”白手套”模式：为什么最大的 Agent 平台要派人上门

如果 Agent 真的像 Demo 里展示的那样即插即用，Salesforce 为什么要组建一支专门的”前沿部署工程师”（FDE）团队，以三人小组的形式上门给客户手把手做陪伴？

答案在于 Agent 落地的本质不是技术部署，而是组织转型。

FDE 团队的构成耐人寻味——它不是传统的实施顾问团队，也不是普通的技术支持。Cramer 这样描述：”他们是一种新型的混合体，兼具咨询师的外交手腕和深度软件工程师的技术功底。”每个小组三人，混合了资深技术专家和年轻工程师，既能和 CTO 谈战略，也能卷起袖子写代码。

更关键的是 FDE 的工作模式。他们不是替客户做完就走的外包，而是”肩并肩”的共建者。”有时候他们在建，我们在旁边；有时候我们在建，他们在旁边。但最终我们离开时，他们拥有了自己继续前进的技能和经验。”这套”白手套”模式本质上是在做知识转移和组织能力建设。

FDE 团队观察到一个明显的客户演化轨迹。早期，客户卡住的原因往往不是技术——而是”不知道从哪里开始”。每家企业都感受到了必须用 AI 转型的压力，但具体怎么做、先做什么、做多大，完全没有概念。”帮我建一个路线图，帮我理解我的用例，帮我排优先级”——这才是客户最初真正需要的。

成功案例印证了一条通用法则：从小处开始，从具体问题开始。交通和酒店服务商 Engine 的做法堪称教科书——它没有试图”煮沸整个海洋”，而是锁定了一个具体痛点：航班取消处理。两周部署，效果立竿见影。然后才在此基础上扩展更多能力。零售商 Williams Sonoma 的路径类似：先在 Pottery Barn Kids 这一个品牌上跑通，然后在 8 个品牌上做”冲洗-重复”式渐进推广。

这些案例的共同点不是技术多强，而是组织策略多聪明——缩小范围、降低风险、快速验证、渐进扩展。Agent 落地的最佳实践，本质上是变革管理的最佳实践。

四、Workday 收购 Sana 的启示：垂直碾压通用

如果说 Salesforce 的 FDE 模式揭示了 Agent 落地的”怎么做”，Workday 用 11 亿美元收购 Sana 则回答了一个更根本的问题：企业应该选择什么样的 Agent？

答案是：垂直的，而不是通用的。

最能说明问题的不是 Sana 的 300 多个预建技能，不是它能把 24 项跨越 6 个系统的手动任务压缩成一次对话，甚至不是它在 Workday 的 HR 和财务系统中的深度集成。最能说明问题的是一个客户案例：Sana 客户 Berner 在部署后仅 40 天就达到了 90% 的员工采纳率，并退掉了此前购买的 400 个 ChatGPT 企业版许可证。

退掉 400 个 ChatGPT 许可证——这个动作值得反复咀嚼。

它意味着企业在实际使用后做出了一个判断：通用型 AI 助手在企业场景中的价值上限，远低于一个深度集成到业务系统中的垂直 Agent。ChatGPT 可以帮你写邮件、做摘要、回答问题，但它不能帮你在 Workday 里提交医疗休假申请、在 ServiceNow 里开通软件权限、在 Salesforce 里更新客户记录——因为它没有这些系统的写入权限和业务上下文。

Sana 的架构设计精准击中了这个痛点。它的连接器不是只读的——它们能向第三方应用写入操作。当你对 Sana 说”帮我报销上周出差费用”，它会扫描邮箱找收据、对照公司政策检查合规性、标记不合规项目、在 Workday 里提交报销单。24 个手动步骤变成一次对话。

Workday 的定价模式也值得关注。它采用 Flex Credits 体系——每个客户根据规模获得年度免费配额，每个信用值 0.10 美元，不同的 AI 能力以不同速率消耗信用。用完了可以按订阅方式购买更多。这种从”按座席收费”到”按成果收费”的转变，标志着企业软件经济学的根本性重构。

更深层的启示：Agent 的竞争不在模型层面，而在业务集成深度。Sana 使用多个底层模型，为每个任务选择精度最高、成本最优的方案，有的操作跨多个模型做多层调用。模型是可替换的商品，业务上下文才是护城河。

五、SAP 的四维就绪框架：企业自查清单

如果前面的案例让你跃跃欲试，SAP 的四维就绪框架应该先泼一盆冷水——或者说，递给你一面镜子。

SAP 在其 Joule AI Agent 框架中提出了企业部署前必须通过的四维评估。根据 IDC 的研究数据，通过评估并采用 AI 驱动套件的企业确实获得了显著收益：37% 的流程生产力提升、39% 的成本优化、36% 的劳动力生产力提升、35% 的上市速度加快。但这些数字有个前提——企业必须具备以下四个维度的就绪度。

维度一：数据质量与可访问性。 Agent 的决策质量取决于数据质量。清洁、结构化、实时的跨企业数据是有效决策的基础。数据孤岛、过时数据或上下文缺失都会拖慢采纳并带来差劲的结果。这不是一次性的清洗工作，而是持续的数据治理能力。

维度二：流程成熟度。 Agent 在定义良好的工作流上表现最佳。在自动化之前，企业必须确保业务流程已经标准化、文档化，并准备好被编排。自动化混乱只会创造更快的混乱。

维度三：组织清晰度。 谁来使用这些 Agent？用于什么任务？Agent 如何交接给人类员工？清晰的角色定义和沟通对于采纳和信任至关重要。这不是 IT 部门能独自回答的问题，它需要业务部门、HR 和管理层的共同参与。

维度四：治理与护栏。 就像人类员工一样，AI Agent 需要规则。定义权限、升级路径、伦理边界和审计实践。Agent 应该自主行动，但必须在企业设定的边界内运行。

把这四个维度当作一份自查清单，诚实地给自己的企业打分。如果有两个维度以上拿不到 60 分，你的 Agent 计划可能还不到启动的时候——或者说，你需要先投资的不是 Agent 技术，而是组织基础设施。

六、Agent 经济学：ROI 如何算

Agent 的成本模型正在经历从”按人头算”到”按结果算”的范式转换。理解这个转换对于正确评估 Agent 投资至关重要。

当前市场上主要存在三种定价模式：

按座席计费（Per-Seat）： 传统模式的延续。每月每用户固定费用。但在 Agent 场景下存在根本矛盾——Agent 的价值在于减少使用软件的人数，而按座席收费的逻辑是用户越多收入越高。

按任务计费（Per-Task）： Moltify 等平台采用的模式。合同审核 15 到 50 美元一份，代码安全审计 30 到 100 美元一次。企业月费从几百美元到数万美元不等。

按成果计费（Outcome-Based）： Workday 的 Flex Credits 模式——不按用户数计费，而按 Agent 完成的工作量计费。这种模式最贴合 Agent 的价值逻辑。

AWS 的 Transform 案例提供了量化参考。新西兰最大电力和天然气分销商 Vector Limited 使用 Agent AI 进行云迁移：速度提升 34%，五年总拥有成本降低 35%，60% 的波次规划自动化。以 1800 台生产服务器的假设场景测算，AI 驱动的迁移将总变更成本从 768 万美元降至 482 万美元，五年 ROI 从 22% 跃升至 81%。

Workday 的 NetApp 案例提供了另一个视角：合同智能 Agent 分析 90,000 份采购合同，节省 250 万美元。没有任何企业会雇佣几百名律师手动审查这些合同——AI 改变的不是”做同样的事花更少的钱”，而是”让以前经济上不可行的事情变得可行”。Kazmaier 说得精确：”更大的机会不在效率提升，而在于利用推理单位经济的变化，完成今天所有未完成的工作。”

计算你自己的 Agent ROI 时，应该考虑三层价值：

替代价值——Agent 做了原来人做的事，节省了多少人力成本？
增量价值——Agent 做了原来根本没人做的事，创造了多少新价值？
速度价值——Agent 把原来需要数周的事压缩到数小时，时间差带来了多少机会成本的节省？

大多数企业只算第一层，导致 ROI 被严重低估。真正的价值在第二层和第三层。

七、系列收官：五篇文章的核心地图

回顾这个系列的五篇文章，我们实际上画出了一张 Agent 企业落地的完整地图。

第一篇「Harness Engineering 取代 Prompt Engineering」 确立了核心认知：Agent 的性能瓶颈不在 Prompt，而在外骨骼——检索、工具调用和结构化验证构成的 Harness 层。

第二篇「四大巨头定义企业 Agent 的正确打开方式」 描绘了架构共识：Salesforce、Oracle、ServiceNow、SAP 收敛到”套件集成 + Agent 编排”的模式。

第三篇「AI Agent 安全与治理」 划出了红线：权限控制、提示注入防护、审计追踪——这些不是锦上添花，而是上线的入场券。

第四篇拆解了 Agent 的成本经济学——从 Flex Credits 到 Per-Task 定价，新的经济模型正在重塑企业对 AI 投资的核算方式。

本篇（第五篇） 则把镜头从技术拉回到组织：Agent 落地最大的瓶颈不是模型、不是架构、不是安全——而是组织本身。

五篇文章串起来，核心洞察可以浓缩为一句话：Agent 是一面镜子，照出的不是 AI 的能力边界，而是企业自身的组织成熟度。

八、第三层洞察：组织的”免疫系统”

本篇到这里，所有的案例和框架都指向一个更深层的结论——Agent 落地的最大阻力不是技术，而是企业的”组织免疫系统”。

什么是组织的免疫系统？就是企业在多年运营中形成的一套自我保护机制：现有流程、KPI 体系、权力结构、预算分配逻辑、部门边界和晋升路径。这套系统的核心功能是维持稳定，排斥一切可能打破现有平衡的异物——而 Agent 正是这样的异物。

想象一下：你在客服部门部署了一个 Agent，两周内它学会了处理 80% 的常规工单。客服主管的 KPI 是”管理团队规模”和”招聘效率”——Agent 越好用，他的团队越小，KPI 越难看。他有一百种方式让部署”遇到困难”——数据接口审批拖延、内部测试不断发现”边缘场景”、合规部门要求补充评估……技术上没有一个步骤是错的，但组织免疫系统正在安静而高效地排斥入侵者。

这就是为什么 Salesforce 需要 FDE 团队——不只是为了解决技术问题，更是为了在组织内部建立 Agent 的”盟友网络”。这也是为什么 Workday 选择从 HR 和财务这种高度标准化的领域切入——因为这些领域的流程相对固定，组织免疫反应最弱。这更是为什么 SAP 把”组织清晰度”列为四维评估的第三维——因为如果没有自上而下的组织共识，再好的技术也会被组织抗体吞噬。

Agent 的落地是一场组织手术。你不能只给病人一把手术刀——你需要外科医生（技术团队）、麻醉师（变革管理）、护理团队（培训体系），和最关键的，病人的配合意愿（管理层的真正承诺，不是 PPT 上的”战略优先级”）。

九、写在最后：Agent 时代的清醒剂

Bhusri 考察那些新建的初创公司，发现过去需要 500 人的事情现在 150 人就能做。Sana 创始人 Hellermark 说 100% 的工程师在使用 AI 辅助编程，80%–90% 的代码由 AI 辅助完成——但他们仍在尽可能多地招聘工程师。

这两个事实放在一起，描绘出 Agent 时代的真实图景：不是人被替代，而是人的角色被重新定义。Agent 不是来抢工作的，它是来抢借口的——”数据太多处理不过来”“流程太复杂没法改”“人手不够做不了”——当 Agent 拿走了这些借口，暴露出来的是组织本身的惰性。

对于正在观望的企业，这里有三条务实的建议：

第一，不要等数据完美了再开始。 Engine 的案例证明，锁定一个具体问题、使用一组具体数据、两周内跑出结果，远比花六个月做”数据治理整体方案”更有效。完美是投产的敌人。

第二，不要买通用 Agent，要买垂直 Agent。 Berner 退掉 400 个 ChatGPT 许可证的故事已经说得很清楚：在企业场景中，一个深度集成到业务系统中、拥有写入权限和业务上下文的垂直 Agent，价值远超一个什么都能聊一点但什么都做不了的通用助手。

第三，也是最重要的，先改组织再上 Agent。 或者至少，同步改。用 SAP 的四维框架做一次诚实的自查，看看你的数据、流程、组织和治理是否真的准备好了。如果没有，Agent 的落地只会照出更多的问题——然后被组织免疫系统悄悄杀死。

29,000 笔 Agentforce 交易中，绝大多数还在试点阶段。这个数字不是失败的证据——它是清醒的起点。从 Demo 到生产的鸿沟，填不满它的是更好的模型或更多的功能，而是更成熟的组织、更清晰的流程、和更诚实的自我认知。

Agent 时代真正的竞争力不在于你用了多先进的 AI，而在于你的组织能多快地学会和 AI 一起进化。

本文是「AI Agent 企业落地指南」系列的第 5 篇（收官篇）。整个系列从 Harness Engineering 的技术基本功出发，经过企业架构设计、安全治理红线和成本经济学分析，最终回到了所有技术变革的原点——人和组织。感谢你一路读到这里。

参考资料

Jennifer Cramer on Salesforce Forward Deployed Engineering: Agentic AI hits ‘a difficult age’ — diginomica, 2026
Workday acquires Sana for $1.1B: 300+ AI Skills, 24 Tasks Collapsed Into a Conversation — iTWire, 2026
SAP Joule AI Agent Readiness Framework: The Suite Spot: A Practical Guide to Business AI Agents — GNN Liberia / African Media Agency, 2026
AWS Transform Agentic AI Migration: Accelerating Cloud Migration with AWS Transform and Generative AI — AWS Blog, 2026
AI Agent Pricing Guide: How Much Does an AI Agent Cost? — Moltify, 2026