📢 转载信息
原文作者:Dhawalkumar Patel, Anubhav Sharma, Sahil Thapar, Ujwal Bukka, and Aswin Vasudevan
软件即服务(SaaS)提供商在构建多租户智能体应用时,必须解决超出安全性、治理和响应准确性等常规关注点之外的架构挑战。这些挑战包括租户隔离、租户身份、租户可观测性、数据隔离、成本归属以及“吵闹邻居”(Noisy Neighbor)影响的缓解。将原型开发转化为生产部署,需要专为多租户环境构建的基础设施。
Amazon Bedrock AgentCore 是一项托管的无服务器服务,旨在 AWS 上构建、部署并安全地运营智能体应用。它提供了部署智能体和托管 MCP 服务器的结构,内置了对身份管理、内存、可观测性和评估的支持,所有这些设计都旨在让多租户智能体架构的构建变得简单直接。
构建多租户智能体的设计考量
构建具有强隔离性的安全多租户智能体应用,需要在某些关键组件上做出谨慎的架构决策。每个组件都必须在租户隔离、操作效率和成本优化之间取得平衡,同时保持安全性和合规标准。这些设计考量围绕三种租户隔离模式展开:孤岛(Silo)、共享池(Pool)和桥接(Bridge)模式。
图 1:多租户智能体的设计考量
1. 智能体运行时部署:专用与共享
多租户智能体架构的一个关键决策是智能体运行时的配置方式。专用(Dedicated)运行时为每个租户实例化一个单独的执行环境;共享(Shared)运行时在同一容器镜像和进程池中为所有租户托管智能体,这降低了成本但需要严格的进程内租户上下文传播。
Amazon Bedrock AgentCore Runtime 通过基于微型虚拟机(microVM)的会话隔离计算解决了这一矛盾。AgentCore Runtime 会按会话启动轻量级微型虚拟机,每个会话拥有独立的持久化文件系统,从而降低了跨会话数据泄露的风险。
2. 工作流模式:孤岛、共享池与桥接
多租户智能体应用需要灵活的工作流管理。三种主要模式如下:
- 孤岛模式(Silo):使用特定于租户的技能,每个租户的工作流、逻辑和验证规则都被封装在隔离的智能体技能中。提供了最高级别的定制化。
- 共享池模式(Pool):使用共享智能体技能,通过逻辑区分不同租户。
- 桥接模式(Bridge):将通用工作流步骤(如身份验证、日志记录)嵌入共享技能,并在运行时调用特定于租户的技能来处理业务逻辑。
3. 多租户 RAG
检索增强生成(RAG)系统需要进行数据隔离决策。孤岛模式使用每个租户专用的向量数据库,提供最大的安全性和数据分离,推荐用于受监管行业。共享池模式则使用带有基于元数据的租户过滤和命名空间访问控制的共享向量数据库,以实现成本高效的运营。
4. 细粒度访问控制
AgentCore Policy 可以在工具调用层拦截并评估所有智能体请求。它不仅依赖于静态权限,还会根据当前租户状态、配额和层级权限实时做出授权决定。通过解耦和中心化的策略存储,可以在无需重新部署的情况下动态更新权限。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区