📢 转载信息
原文作者:Nav Bhasin and Sri Elaprolu
Agentic AI 并非一个可以开启的功能,而是一种工作定义、执行者和决策方式的转变。
大多数企业都会在这方面吃亏。他们启动的项目一遇到真实的流程、系统和治理就停滞不前。模式一再重复:模糊的用例、无法应对混乱数据的原型、失控的自主性、因合规而延误的上线日期、数据不足以支持自主决策。这一切的根源都是同一个问题——没有人就成功的标准达成一致。
AWS Generative AI Innovation Center 已经帮助 1000 多家客户将 AI 投入生产,实现了数百万美元的生产力提升。我们的跨职能团队——科学家、战略家和机器学习专家——与客户一起从构思到部署。越来越多的工作涉及代理(agents)。
在本篇文章中,我们将为 C 级高管提供指导:CTO、CISO、CDO 以及首席数据科学/AI 官,以及业务负责人和合规负责人。我们的核心观察是:当 Agentic AI 有效运行时,它看起来不像神奇的软件,更像一个管理良好的团队——每个代理都有明确的工作、一个监督者、一套操作指南以及持续改进的方法。
如果你在一个高管会议中问:“我们是否在 AI 上投入了足够多的资金?”,答案几乎总是肯定的。但如果你接着问:“今天有哪些具体的工作流程因为 AI 代理而有了实质性的改善,我们如何知道?”,房间就会安静下来。
这是两部分系列文章的第一部分。 我们在这里奠定基础:为什么价值差距主要是执行问题,以及什么使得工作真正具有“代理形态”。第二部分将直接面向每个 C 级高管,使用他们各自职责范围内的语言。
企业面临的共同问题
价值差距主要在于工作方式
如果你在一个高管会议中问:“我们是否在 AI 上投入了足够多的资金?”,答案几乎总是肯定的。但如果你接着问:“今天有哪些具体的工作流程因为 AI 代理而有了实质性的改善,我们如何知道?”,房间就会安静下来。
连接这两个答案之间的不是缺乏基础模型或供应商。而是缺乏一种操作系统。在代理创造可见价值的组织中,通常存在以下三点:
- 工作被极其详细地定义。 人们可以一步一步地描述,什么进来了,发生了什么,以及“完成”意味着什么。他们还可以描述出现问题时会发生什么。
- 自主性是有限度的。 代理被赋予明确的权限限制、明确的升级规则,以及人类可以查看和覆盖决策的界面。
- 改进是一种习惯,而非项目。 定期有团队会审视代理上周的表现,它们在哪些方面提供了帮助,在哪些方面造成了摩擦,以及接下来需要改变什么。
在这些方面缺失的情况下,会出现同样的症状:令人印象深刻的概念验证无法离开实验室,试点项目在几个月后悄然死亡,领导者们不再问“我们接下来能做什么?”,而是开始问“为什么我们在这些上面花费了这么多?”
什么使得工作具有“代理形态”
大多数组织都以“我们可以在哪里使用代理?”这个问题开始。更好的起点是“哪些工作已经像代理可以完成的工作一样被结构化了?”实践中,这意味着四件事。
首先,工作有清晰的开始、结束和目的。 收到一份索赔。出现一张发票。打开一个支持工单。代理能够识别何时拥有足够的信息开始工作,它正在朝哪个目标努力,以及任务何时完成或需要移交。这不仅仅是一个触发器和终点线。代理需要足够理解工作的意图,以处理合理的变化,而无需被明确告知每种情况该怎么做。如果你的团队无法清晰地阐述给定任务的“完成得好”的标准,包括如何处理异常和边缘情况,那么这项工作还没有准备好交给代理。

其次,工作需要跨工具的判断。 代理不遵循固定的脚本。它会思考需要什么信息,决定查询哪些系统,解释它找到的内容,并根据上下文确定正确的操作。与传统自动化不同的是,路径不是硬编码的:代理会适应其方法,处理变化,并知道何时某种情况超出了其能力范围。但是代理通过工具来运作,而这些工具必须在代理存在之前就已建立。你的系统需要有定义明确、安全可靠的接口,代理可以调用这些接口来读取数据、写入更新、触发交易或发送通信。如果今天的流程是人工在电子邮件和电子表格中进行推理,那么在你拥有可行的代理用例之前,你还需要进行流程设计和工具准备工作。
第三,成功是可以观察和衡量的。 一个不属于该团队的人可以查看输出并说“这是正确的”或“需要修复”,而无需读心术。这可能包括检查工单是否按时解决,表格是否完整且一致,交易是否平衡,或者客户是否得到了他们需要的响应。但可观察性不仅仅是抽查输出。你需要看到代理是如何得出答案的:它使用了什么数据,调用了什么工具,考虑了什么选项,以及为什么选择某个选项。如果你无法评估推理过程,你就无法改进代理,也无法在出现问题时为其决策辩护。
从操作可逆或代理输出是供人类采纳的建议的工作开始。随着信任、控制和评估的成熟,你就能赢得在更高风险的工作中让代理自主完成闭环的权利。
第四,工作在出现问题时有安全模式。 最早适合作为代理候选的工作是那些错误能被快速发现、廉价纠正且不会造成不可逆损害的任务。如果代理错误地分类了支持工单,它可以被重新路由。如果它起草了一份不正确的回复,人类可以在发送前进行编辑。但是,如果代理批准了一笔付款、执行了一笔交易或发送了一份具有法律约束力的通信,那么犯错的成本将完全不同。从操作可逆或代理输出是供人类采纳的推荐的工作开始。随着信任、控制和评估的成熟,你就能获得在更高风险的工作中让代理自行完成闭环的权利。
当这四个要素都具备时,你就拥有了可以成为代理工作的内容。当它们缺失时,对话就会回到像助理、副驾驶或自动化这样的模糊标签,在房间里的每个人心中都有不同的含义。
行动号召
准备好弥合执行差距了吗?
第一部分描述的模式并非理论性的。它们出现在各种规模、各个行业的组织中。好消息是:你当前的位置和你想要达到的位置之间的差距不是技术差距。它是一个执行差距,而执行差距是可以解决的。
本周你可以做以下三件事:
- 命名工作,而非愿望。选择你组织中的一项工作流程,它有清晰的开始、清晰的结束和可衡量的“完成”定义。这就是你的第一个代理候选。
- 在会议中提出棘手的问题。在你下一次领导会议中,不要问“我们是否在 AI 上投入了足够多的资金?”而是问:“今天有哪些具体的工作流程因为 AI 代理而有了实质性的改善,我们如何知道?”随之而来的沉默就是你的路线图。
- 开始撰写职位描述。在任何技术决策之前,写下代理会做什么,它需要什么工具,成功的标准是什么,以及失败时会发生什么。如果你无法填写这一页,那么你还没有准备好构建,而这是有价值的信息。
即将推出第二部分:按角色划分的指导
知道 Agentic AI 是一个执行问题是一回事。知道你在解决它中的角色是另一回事。
在第二部分,我们将直接与需要实际执行这项工作的领导者对话:需要将代理与 KPI 挂钩的业务线所有者,需要在十个一次性代理或一百个代理平台之间做决定的 CTO,必须将代理视为同事而非代码的 CISO,需要让数据变得“无聊”(以最好的方式)的 CDO,以评估为产品核心的首席 AI 官,以及必须在审计发生前就设计好审计程序的合规负责人。
每个角色。每个职责。每项具体行动。
与 Generative AI Innovation Center 合作
你无需独自踏上这段旅程。无论你是正在规划你的第一个 Agentic 试点,还是正在扩展到企业级的能力,都可以联系 Generative AI Innovation Center 团队,与我们开启一段基于你的工作流程、你的数据和你的业务成果的对话。
关于作者
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区