目 录CONTENT

文章目录

您的治理能力能跟上AI雄心吗?智能体时代的AI风险情报

Administrator
2026-04-01 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/can-your-governance-keep-pace-with-your-ai-ambitions-ai-risk-intelligence-in-the-agentic-era/

原文作者:AWS Machine Learning Blog


DevOps 曾经是可预测的:相同的输入,相同的输出,二元化的成功标准,静态的依赖关系,具体的指标。你可以控制你所能预测的事物,衡量具体的内容,并保护遵循既定模式的流程。

然而,智能体 AI(Agentic AI)的到来改变了一切。

智能体具有非确定性,它们不遵循固定的模式。即使问同一个问题两次,也可能得到不同的答案。它们在工作时会选择不同的工具和方法,而不是遵循预设的工作流。质量存在于从完美到伪造的梯度之间,而非简单的通过/失败。传统的 IT 治理框架专为静态部署而设计,无法应对这些复杂的多系统交互。组织正面临跨智能体工作流的安全态势不一致、合规性差距因部署而异,以及业务利益相关者因缺乏深厚技术背景而难以理解的可观测性指标等问题。

这种转变要求我们重新思考安全、运维和治理,将其作为智能体系统健康的相互依存维度。这也是 AI 风险情报(AIRI)的起源:这是来自 AWS 生成式 AI 创新中心的企业级自动化治理解决方案。它将安全、运维和治理控制的评估整合到一个跨越整个智能体生命周期的单一视角中。为了构建这一解决方案,我们使用了 AWS 负责任 AI 最佳实践框架,该框架基于我们处理数十万个 AI 工作负载的经验,帮助客户在 AI 生命周期内解决负责任 AI 的考量,并做出明智的设计决策以加速受信任 AI 系统的部署。

AI风险情报图表

从静态控制到动态治理

考虑智能体系统中一个常见的安全风险。开放全球应用安全项目(OWASP)——一个追踪网络安全漏洞的非营利组织——将“工具滥用与利用”列为 2026 年智能体应用十大安全风险之一。

想象一个企业 AI 助手拥有访问电子邮件、日历和 CRM 的权限。攻击者在邮件中嵌入恶意指令。当用户请求总结邮件时,受损的智能体便会遵循隐藏的指令——搜索敏感数据并通过日历邀请将其外泄——同时提供良性响应以掩盖违规行为。这种未授权的访问完全是在授予的权限内操作:AI 助手被授权阅读邮件、搜索数据和创建日历事件。标准的数据防泄漏工具和网络流量监控无法评估智能体的操作是否符合预期范围,因为它们只标记异常的数据移动和网络流量,而这种未授权访问并未产生这些迹象。为了大规模治理多智能体系统,安全必须直接集成到智能体的运作方式中。

智能体风险的系统性本质

上述日历数据外泄场景揭示了一个关键点:在智能体系统中,安全漏洞会在多个运维维度同时连锁反应:

  • 多智能体协作:一个智能体的操作触发了其他智能体,放大了违规行为。
  • 权限管理:在智能体运行期间,访问控制未得到持续验证。
  • 人工监督:在智能体执行高风险操作前,缺乏要求人工确认的检查点。
  • 可见性:风险管理者无法解读监控数据,从而无法在数据被盗前发现问题。

AIRI 将 NIST AI 风险管理框架、ISO 和 OWASP 等框架付诸实践,将它们从需要人工解读的静态参考文档,转化为嵌入整个智能体生命周期的自动化、持续性评估。AIRI 与特定框架无关,它针对治理标准进行校准,这意味着评估 OWASP 安全控制的同一引擎,也可以评估组织透明度策略或特定行业的合规性要求。

AIRI评估示意图

AIRI 的实际应用

AIRI 通过提取框架评估准则,并从系统实际制品(架构文档、智能体配置、组织策略)中获取证据,运行推理循环。这种基于推理的方法使其具备广泛的适用性,无需为已知的威胁硬编码规则。为了增强判断的可靠性,AIRI 还会重复评估并测量结论的一致性,这种技术被称为“语义熵”(semantic entropy)。如果输出差异显著,系统会触发人工审核,而不是盲目判断。

控制维度评估图

将治理转化为竞争优势

向动态治理的转变决定了哪些组织能够自信地扩展智能体工作负载,而哪些会被手动监管所束缚。对于安全团队、运维团队、风险管理者乃至高管而言,AIRI 都代表了一种竞争优势:能够更快地部署、可靠地扩展并高效地保持合规。

您准备好自信地扩展您的智能体工作负载了吗? 探索 AIRI 如何改变您的 AI 治理策略——联系我们以了解更多信息或预约演示。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区