目 录CONTENT

文章目录

企业中的智能体 AI 第二部分:按角色指导

Administrator
2026-03-17 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/agentic-ai-in-the-enterprise-part-2-guidance-by-persona/

原文作者:Nav Bhasin and Sri Elaprolu


这是 AWS 生成式 AI 创新中心两部分系列文章的第二部分。如果您错过了第一部分,请参考 《企业中智能体 AI 的运营化:利益相关者指南》

智能体 AI 最大的障碍不是技术,而是操作模式。在 第一部分 中,我们确定了真正从智能体中获得价值的组织通常具备三个特征:它们详细定义工作内容,审慎地约束自主性,并将改进视为一种持续的习惯而非一次性项目。我们还介绍了真正“适合智能体”的工作的四个要素:清晰的开始和结束、跨工具的判断、可观察和可衡量的成功,以及安全的失败模式。没有这些基础,即使是最复杂的智能体也会在实验室中停滞不前。

现在,更棘手的问题来了: 来让它工作,如何 来做?

在第二部分中,我们将直接与那些必须将共享基础转化为行动的领导者对话。每个角色都承担着独特的责任、风险和影响力。无论您负责损益表、企业架构、安全、数据治理还是合规管理,本部分都将用您的工作语言来阐述——因为智能体 AI 要么在这里成功,要么在这里悄然夭折。

第二部分 – 按角色指导

对于业务线负责人:让智能体为您的 KPI 负责。

如果您负责损益表,您不需要另一个技术玩具。您需要更少的待处理工单、更短的现金转换周期、更少的购物车放弃、更少的合规例外。只有当智能体能直接关联到这些数字时,它才有价值。

第一步是为智能体撰写一份职位描述,就像为新员工一样。“该智能体接收 X 类型的入站请求,检查 Y,执行 Z,并在完成后移交给本团队。” 明确您的运营术语中的“完成”意味着什么:响应时间、质量阈值、升级触发器和面向客户的承诺。

第二步是将业务案例锚定在您团队已跟踪的数字上。每周有多少个单位通过此工作流程?每个单位在人力、返工和冲销方面的成本是多少?它在队列中等待了多久?由于某个环节缺失或错误而导致它被退回的频率有多高?如果您今天无法回答这些问题,那么您的第一个项目不是智能体——而是对工作流程进行仪器化。

第三步是排序。在旅程的早期,最有用的智能体通常是那个可以减少交接的智能体:它读取入站请求,从多个系统中收集上下文,提出计划,并将带有预先准备好所有内容的计划交付给您的团队。它可能无法自行“闭环”,但它可以消除数小时甚至数天往返的时间。这类节省成本的胜利有助于建立与 CFO 的信誉,并为您争取追求更宏大、更侧重于收入的用例的政治资本。

业务线负责人不需要理解模型或提示。他们需要负责一小部分直接与其指标挂钩的智能体作业,并且他们需要坚持每一项计划都以书面的工作合同开始,而不是以一个标签的幻灯片开始。

对于 CTO 或首席架构师:决定您想要十个智能体还是百个

如果您是 CTO,您最大的风险之一就是成功。一旦第一个智能体落地成功,其他团队也会想要一个。如果每个团队都构建自己的堆栈——自己的框架、自己的连接器、自己的访问模型——您最终将拥有一个庞杂的智能体系统,它们外观不同、测试方式不同,并且整体上难以监控。

架构问题很简单陈述,但执行起来很难:您是想要十个令人印象深刻的独立智能体,还是想要一个能够安全支持百个智能体的系统?

系统路径要求您提前做一些艰苦的工作。这意味着标准化工具的暴露方式,以便每个智能体在需要读取客户数据、更新工单或处理付款时都调用相同的集成。这意味着在您的设计中将“思考”与“行动”分离:一个组件进行规划,另一个组件调用工具,另一个组件检查合规性,另一个组件向用户解释决策。这意味着以一致的格式捕获决策轨迹,以便可观察性和调试能够跨用例工作。

这还要求您将智能体视为长期运行的服务,而不是短暂的脚本。它们需要身份、权限、轮换、生命周期管理,以及一种在不破坏其消费者的情况下进行升级的方式。这在第一天会增加更多工作,但它能让您在不从头开始的情况下对想要智能体的第十个团队说“是”。

CTO 的工作不是在真空中选择最佳的智能体框架。而是构建一个坚实的基础——身份、策略执行、日志记录、连接器和评估钩子——让许多团队能够安全、快速、一致地发布智能体。

对于 CISO:像对待同事一样对待智能体,而不是代码

如果您负责安全,您习惯于从资产的角度思考:系统、数据存储、凭证。智能体为您的威胁模型增加了一些新东西:能够以机器速度做出决策和采取行动的授权实体。

错误在于将智能体视为另一个应用程序。它们更像是同事。它们有账户。它们有角色。它们可以使用工具。它们会犯错。它们可能会被错误配置。

实际的做法是,以您对待人类身份的同等严肃程度来为智能体设置非人类身份。每个智能体都应该有自己的凭证、自己的权限和自己的审计跟踪。它不应该继承它碰巧运行的那个服务账户的所有权限。当智能体读取敏感数据或调用高风险工具时,这应该在您的日志中以您的团队可识别的方式显示出来。

您还将需要干净利落地停止智能体的方法。这意味着真正起作用的“终止开关”,而不仅仅是设计文档中的一行。这意味着制定“此类操作始终需要人工批准”的策略,并在工具层面强制执行,而不仅仅是在智能体的提示中。这意味着要监控行为的漂移:一个智能体突然比平时更频繁地调用某个工具,或者开始读取它以前不需要的数据。

成功适应智能体 AI 的 CISO 不会试图完全阻止自主性。他们会定义自主性在何处可接受,需要什么证据来信任它,以及在信任被打破时会发生什么。他们会尽早加入设计对话,并将策略作为智能体形状的一部分,而不是最后的障碍。

对于首席数据官:让数据变得“无聊”

智能体能够放大您现有的任何数据基础。如果您的数据是碎片化的、过时的和未记录的,智能体可以迅速将这些问题暴露给所有人。如果您的数据是一致的、治理良好的且易于理解的,智能体就可以成倍地增加其价值。

CDO 在智能体时代的工作就是让数据变得“无聊”,以最好的方式。这意味着当一个智能体询问“显示所有超过此阈值的所有未处理索赔”时,无论它在哪个区域或业务线运行,都能得到一致的答案。这意味着存在一个“客户健康分数”的定义,并且它被充分记录,以便人类和智能体都能使用。这意味着清晰的血缘关系:当出现问题时,您可以追溯决策,从指标到特征,一直到源系统。

这也意味着要现实地看待就绪情况。有些工作流程根本没有为自主决策做好准备,因为它们依赖的数据不完整或相互矛盾。最好的 CDO 会迎难而上。他们不会说:“我们无法支持智能体。” 他们会说:“我们今天可以支持这类工作。如果您想自动化其他类的工作,我们首先需要改进这些数据。”

CDO 对智能体对话最宝贵的贡献之一就是一张地图:哪些域拥有生产级数据,哪些正在进行中,以及有哪些潜在的陷阱。这张地图可以帮助其他人在选择第一个工作时明智地进行,而不是在实施过程中才发现数据债务。

对于首席数据科学或 AI 官:评估是您的真正产品

如果您领导数据科学或 AI,很容易专注于模型:哪个基础模型、哪个微调技术、哪个基准分数。这些决策很重要,但在生产环境中,您的真正产品是围绕模型的评估系统。

智能体可能会以基准测试无法衡量的方式失败。它们会陷入循环。它们会错误地调用工具。它们会以看似合理但实际上错误的方式半途而废。它们在干净的测试数据上表现良好,但在没有人想到要包含的边缘情况下会崩溃。一个有效的评估系统可以做三件事。

首先,它将实际工作转化为测试。当智能体在生产中犯错时,该场景将成为不断增长的评估套件的一部分。随着时间的推移,您遇到的最困难的案例将成为保护您免于退化的护栏。

其次,它会自动运行。对提示、模型、工具或检索索引的更改会在更改上线之前触发评估。这让您有信心快速迭代,因为您不必依赖少数的抽查和运气。

第三,它衡量业务关心的内容。这包括延迟和工具成功率等技术指标,还包括任务完成率、升级率、每次决策的成本以及用户接受智能体建议的比例。当这些数字可见且在改善时,信任就会随之而来。

在此早期进行投资的团队会发现模型选择变得更简单,而不是更难。一旦您可以看到模型在您的实际任务上的行为,关于“哪个模型是最好的?”的辩论就会变成基于事实的比较,而不是哲学讨论。

对于合规或法律官:在面临审计之前设计好审计流程

如果您对合规或法律风险负责,智能体 AI 可能看起来像一个移动的目标。法规在不断演变,供应商营销的速度常常快于监管的清晰度。您不能等到所有标准都确定下来才冻结组织,但也不能容忍“我们以后会解决治理问题”。

一种务实的方法是从审计的角度倒推。想象一下,监管机构或内部审计委员会问道:“在那个日期,为什么这个智能体要采取那个行动?” 现在就决定您需要什么证据来清晰、快速地回答这个问题。

这意味着一些设计选择。每个智能体都应该留下一个轨迹:它看到了什么输入,调用了什么工具,考虑了什么选项,它选择了什么,以及它应用了什么规则。对于像信贷决策、保险承保和与就业相关的行动等高风险领域,必须保留人工参与,并且智能体的作用应该是咨询性或准备性的:收集数据,组织证据,提出行动。人工批准将成为记录的一部分。

这也意味着并非所有智能体的想法都是允许的。一些用例完全落在监管的“禁区”内,直到框架和控制措施成熟。您的工作是尽早使这些界限可见。当您能为一些智能体提供明确的“是”的条件,为另一些提供明确的“稍后是”的先决条件,并为少数提供清晰理由的“否”时,您就可以成为一个赋能者,而不是一个阻碍者。

您可以为其他领导团队做的最有帮助的事情之一是,将“我们需要负责任的 AI”这样的抽象担忧转化为一个具体的清单,可以在每个提议的智能体项目开始前进行应用。

行动号召

如果本帖中的模式听起来很熟悉,您并没有落后。您正处于大多数企业所在的位置。区分那些前进的人的是将智能体 AI 视为操作模式挑战,而不是技术实验的决定。您可以采取的五个开始行动的步骤:

召集合适的房间。 召集您的业务线负责人、CTO、CISO、CDO、AI/DS 领导和合规负责人——不是为了演示,而是为了一个工作会议。每个人回答一个问题:“阻碍我们将一个智能体投入生产并用于实际工作流程的最大障碍是什么?”

选择一个工作,而不是一个用例。 确定一项具体的工作,有清晰的开始、清晰的结束、定义的工具和一个团队以外的人可以验证的成功指标。一起写下智能体的工作描述。如果房间无法就“完成”的定义达成一致,那么您就找到了第一个需要解决的问题。

绘制您的就绪图。 让您的 CDO 和 CISO 共同绘制出哪些数据域和系统目前已准备好进行自主决策,哪些需要先改进,以及哪些是潜在的危险区域。那张单页图可以为您节省数月的浪费。

承诺一个节奏。 设置一个定期的每周或每两周一次的审查会议,让跨职能团队检查智能体的行为,哪些有效,哪些中断,以及需要调整什么。如果您只在启动时进行评估,您就是在构建一个演示。如果您持续评估,您就是在构建一个能力。

将治理作为设计输入,而不是启动门。 现在就决定,如果审计人员在六个月后问“为什么这个智能体做了这个?”时,您需要什么证据。在编写第一行代码之前,将这些证据整合到架构中。

那些从智能体 AI 中获得真正价值的企业,是通过做那些不那么光鲜的工作而实现的:精确定义工作,审慎约束自主性,持续投资于评估,并围绕共享的操作模式来协调利益相关者。

与生成式 AI 创新中心合作

您不必独自踏上这段旅程。无论您是在规划您的第一个智能体试点,还是正在扩展到企业范围的能力,请联系 生成式 AI 创新中心 团队,开始一次基于您的工作流程、您的数据和您的业务成果的对话。


关于作者

Nav Bhasin

Nav Bhasin 是 AWS 生成式 AI 创新中心的高级数据科学经理,他加速了企业客户从智能体 AI 概念到生产部署的旅程。Nav 在跨工业、能源和医疗保健领域构建 AI 产品方面拥有十多年的经验,在 AWS 工作了六年,领导了全球 GenAI 架构师和科学家团队,在将 Amazon Bedrock、Amazon SageMaker 和 AgentCore 等产品推向生产应用方面发挥了核心作用。在加入创新中心之前,他领导了 AWS 核心 GenAI 产品组合的市场推广架构和数据科学团队。在加入 AWS 之前,Nav 曾担任 Utopus Insights 的数据科学与工程主管,并领导 Honeywell 的工程与架构部门。Nav 拥有 MBA 学位和电子工程研究生学位。

Sri Elaprolu

Sri Elaprolu 是 AWS 生成式 AI 创新中心的总监,他领导着一个全球团队,为企业和政府组织实施尖端的 AI 解决方案。在他 13 年的 AWS 任职期间,他曾领导 ML 科学团队,与全球企业和公共部门组织合作。在加入 AWS 之前,他在诺斯罗普·格鲁曼公司担任了 14 年的产品开发和软件工程领导职务。Sri 拥有工程科学硕士学位和 MBA 学位。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区