目 录CONTENT

文章目录

使用 Amazon Bedrock AgentCore 和 Amazon Bedrock Knowledge Bases 构建智能活动代理

Administrator
2026-02-26 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/building-intelligent-event-agents-using-amazon-bedrock-agentcore-and-amazon-bedrock-knowledge-bases/

原文作者:Dani Mitchell, Akarsha Sehwag, and Sergio Garcés Vitale


大型会议和活动会产生海量信息——从数百个会议和研讨会到演讲者简介、场地地图以及不断更新的日程安排。虽然基础的 AI 助手可以回答关于活动后勤的简单问题,但大多数助手无法提供与参会者有效应对复杂、多日会议所需的那种个性化指导和情境感知能力。更重要的是,将这些原型从演示推向生产——需要应对企业安全、支持数千并发用户的可扩展性以及可靠的性能——通常需要数月的基础设施开发。

本文将演示如何使用 Amazon Bedrock AgentCore 的组件快速部署一个可投入生产的活动助手。我们将构建一个智能伴侣,它可以记住参会者的偏好并随着时间的推移建立个性化体验,同时 Amazon Bedrock AgentCore 负责处理生产部署的繁重工作:Amazon Bedrock AgentCore Memory 用于在无需自定义存储解决方案的情况下维护对话上下文和长期偏好;Amazon Bedrock AgentCore Identity 用于安全的多种身份提供商(IDP)认证;以及 Amazon Bedrock AgentCore Runtime 用于无服务器扩展和会话隔离。我们还将使用 Amazon Bedrock Knowledge Bases 来进行托管的检索增强生成(RAG)和事件数据检索。

到最后,您将了解到如何部署一个助手,它会随着每一次互动变得更有帮助——一个积极主动的向导,确保参会者能够发现他们最有价值的会议——所有这些都无需管理基础设施,即可为数千名并发参会者提供企业级的安全性和可靠性。

如果您不熟悉 Amazon Bedrock AgentCore,请在深入研究本实施方案之前回顾以下博文,以了解基础概念:

解决方案架构

让我们来了解一下智能活动代理的架构和工作流程。完整的实现可在该 GitHub 存储库中找到,其中提供了一个指导性 Notebook,您可以在其中按照步骤在自己的 AWS 账户中部署此解决方案。

解决方案的工作原理

让我们探讨不同的部分:

1. 用户登录和身份检索

用户使用 Amazon Cognito(AgentCore Identity 也支持其他身份提供商,如 Okta、Auth0 和 OIDC 兼容的 IDP)登录应用程序,成功认证后会生成一个持有者令牌(bearer token)。该令牌包含用户信息,并将在整个工作流程中用于认证和检索特定于用户的数据。

2. 代理调用和初始化

当用户与应用程序互动并提交查询时,应用程序会向 Amazon Bedrock AgentCore Runtime 传递三个关键参数:用户的查询、会话 ID(例如,SessionA)以及来自 Amazon Cognito 的持有者令牌。这会将互动与用户和他们当前的会话关联起来。AgentCore Identity 会在允许访问代理之前对用户进行认证和授权。

在第一次互动时,Strands Agent 会在 Amazon Bedrock AgentCore Runtime 中初始化,并从 Amazon Bedrock AgentCore Memory 的长期存储中检索任何可用的用户偏好,用个性化上下文为自身预热。对于同一会话中的后续互动,代理会使用已建立的上下文继续对话。

3. 消息处理

代理将用户消息和助手消息都存储在 Amazon Bedrock AgentCore Memory 的短期存储中,其中包含 actor_idsession_idactor_id 是从 Amazon Cognito 持有者令牌中提取的 sub(主体标识符),而 session_id 来自 AgentCore Runtime 会话标识符。对话上下文保持私密,仅对当前会话中的特定用户可用。在幕后,Amazon Bedrock AgentCore Memory 采用转换管道,通过配置的内存策略自动处理这些对话事件。

每种内存策略都使用模式识别和自然语言理解来分析原始对话数据,识别出值得长期保留的特定类型有价值信息——例如用户偏好。然后,系统将这些提取的信息结构化为标准化的内存记录,用相关元数据进行标记,并存储在长期内存中的专用命名空间中,供代理用于跨多个会话建立对用户的日益完善的理解。

4. 知识和内存检索

为了完成用户的请求,代理可能会触发专门的工具。它可以调用 Amazon Bedrock Knowledge Base 来获取最新的事件详细信息,例如会议描述、日程或演讲者简介。

5. 响应生成

代理处理查询,该查询已通过三层上下文丰富:来自长期内存的见解(个性化的参会者历史)、来自短期内存的上下文(会话中的近期消息)以及来自知识库的当前事件数据。然后,它生成一个情境化和个性化的响应。这种架构将一个简单的查询,如“我明天应该参加哪些会议?”,转变为个性化体验——代理会回忆起用户昨天喜欢的议题,考虑当前的对话,并根据用户的兴趣和历史提供具体的建议。

解决方案组件

现在让我们了解解决方案中每个组件的作用。

代理(AgentCore Runtime 和身份集成)

我们活动助手解决方案的核心是 Amazon Bedrock AgentCore Runtime,它提供了一个用于托管我们代理的安全、无服务器环境。Runtime 通过隔离的会话管理用户互动的完整生命周期——每个会话都在具有独立 CPU、内存和文件系统资源的专用微型虚拟机(microVM)中运行。这种会话隔离确保了数千名参会者可以同时与代理的个性化实例进行互动,而不会发生跨会话数据污染。

安全和认证由 Amazon Bedrock AgentCore Identity 处理,它与 Amazon Cognito(以及其他 IDP)无缝集成。当参会者向活动助手发送查询时,Amazon Bedrock AgentCore Identity 会验证来自 Amazon Cognito 的持有者令牌,然后才允许互动继续。持有者令牌通过标头传播,代理会检索此令牌以调用 Amazon Cognito 发现服务器,从而提取用户的 sub 和其他相关的用户信息。对于此用例,我们将用户的 sub 用作会话信息的 actor_id,使代理能够维护特定于用户的上下文并提供个性化建议。这种身份感知有助于确保每位参会者的偏好、对话历史和会话数据都能保持私密和安全。

通过将 Runtime 的可扩展托管基础架构与 Identity 的认证框架相结合,我们的活动助手可以更安全地服务于大型会议,同时为每位个人参会者提供持续的个性化指导。

代理内存

Amazon Bedrock AgentCore Memory 提供了关键的情境感知能力,将我们的活动助手从一个简单的问答工具转变为一个真正个性化的向导。该服务由短期内存和长期内存组成,它们协同工作,使参会者与活动助手之间能够建立持续、不断发展的关系。

短期内存:捕获对话

短期内存是互动的起点。随着对话的展开,代理会将每一次消息交换作为不可变的事件同步存储在短期内存中。如示意图所示,这些事件按 actor_idsession_id 进行分层组织。请记住,actor_id 是从 Cognito 持有者令牌中提取的(即用户的 sub),而 session_id 来自 AgentCore Runtime 会话标识符。

这种组织结构有两个关键目的。首先,它维护了每次对话的按时间顺序叙述,保留了对话的自然流程。其次,它提供了精确的隔离——Actor A 在 Session A1 中的对话与 Session B 或另一个 actor 的会话保持分开。这有助于保护隐私,并使代理能够在不加载不必要数据的情况下精确检索正确的对话上下文。代理可以快速从短期内存中检索近期消息以保持对话连续性。当参会者提出后续问题,如“那个会议什么时候开始?”时,代理知道刚刚讨论的是哪个会议,因为它能立即访问对话历史记录。

长期内存:构建持久性智能

虽然短期内存捕获了所说的内容,但长期内存会提取重要的内容。随着对话的发生,AgentCore Memory 服务会自动处理这些互动,以识别并存储在会话中持久存在的有意义的见解。我们的活动代理使用 用户偏好 策略来捕获有关会议格式、主题或演示风格的明确偏好。例如,“偏爱动手操作的研讨会而非讲座”或“对无服务器和机器学习主题感兴趣”。

这些偏好存储在长期内存中的专用命名空间中(例如,/event-agent/actor-A/preferences),以便于清晰组织和定向检索。

代理和内存编排

Strands Agent 和 AgentCore Memory 之间的无缝集成通过代理钩子(agent hooks)得到支持——这些是事件驱动的接触点,会在代理生命周期的各个阶段自动触发内存操作。如下示意图所示:

  • Agent Initialized Event (代理初始化事件) 钩子在会话开始时从长期内存中检索用户偏好,加载参会者的兴趣和首选会议类型,以便从第一次查询开始就能实现个性化推荐。
  • Message Added Event (消息添加事件) 钩子捕获每个用户和助手消息,将它们同步存储在短期内存中以维护对话历史记录。

注意虽然 AgentCore 提供了一个 自动内存管理器 会自动实现内存工具,但本解决方案使用钩子来精确控制何时以及如何调用内存操作——以便针对活动助手特定的工作流程进行微调优化。

除了这些自动操作之外,如果信息不足,代理随后会使用 Retrieve sessions data (检索会话数据) 工具来查询 Amazon Bedrock 知识库以获取当前的事件详细信息。

这种双重方法——在启动时预加载基本上下文,并在需要时选择性地检索详细信息——可以在不使会话上下文臃肿的情况下提供速度和精度。

Amazon Bedrock Knowledge Bases

虽然 AgentCore Memory 维护个性化上下文和对话历史记录,但大型会议会产生大量的结构化信息——数百个会议详情、演讲者简介、场地地图和日程更新——这些信息需要高效的组织和检索。

Amazon Bedrock Knowledge Bases 是一项全托管服务,它通过将基础模型连接到您的数据源来支持检索增强生成(RAG)。它会自动处理文档的摄取、处理和索引,将它们转换为存储在向量数据库中的向量嵌入。这使得代理可以执行语义搜索——根据意义和上下文而不是精确的关键字匹配来检索信息。

该架构将知识库实现为 Strands 框架中的一个专用工具。当参会者询问有关会议、演讲者或场地后勤的具体问题时,代理会调用此工具来检索精确、最新的信息。内存和知识库之间的集成创造了一个强大的组合。当参会者询问“我应该参加哪些 AI 会议?”时,代理会从知识库中检索会议详细信息,同时利用内存根据参会者先前表达的兴趣来过滤和优先排序建议。这有助于产生既事实完整又与个人相关​​的回答,从而将大型会议的压倒性复杂性转化为可管理的、量身定制的指导。

结论

在本文中,我们探讨了如何使用 Amazon Bedrock AgentCore 组件来快速生产化一个活动助手——将其从原型转变为可扩展的企业级部署。虽然使用各种工具可以实现构建智能对话代理,但真正的挑战在于生产部署。Amazon Bedrock Knowledge BasesAmazon Bedrock AgentCore 的价值在于它们开箱即用地提供了托管服务,处理认证、扩展、内存管理和 RAG 功能——有助于省去数月的基础设施工作。

最终结果是一个活动助手,它能记住参会者昨天对话中对无服务器技术的兴趣,理解他们偏爱动手操作的研讨会,并利用这种上下文从明天的日程中提供相关建议——同时保持正在进行的规划会议的对话流程。

这区分了展示智能行为的原型和一个能够为数千名并发参会者提供安全性和可靠性的生产级系统,后者能提供个性化体验。无论您是计划小型公司聚会还是大型多日会议,Amazon Bedrock AgentCore 都提供了在几天而不是数月内部署智能助手的托管基础设施。

后续步骤

准备好进一步增强您的活动助手了吗?以下是扩展此解决方案的一些方法:

  • 使用 AgentCore Gateway 扩展功能Amazon Bedrock AgentCore Gateway 有助于您将活动助手与额外的工具和服务大规模连接起来。将现有 API、Lambda 函数或第三方服务转换为代理可以使用的工具——无论是集成到活动注册系统、连接到 Slack 进行参会者通知,还是链接到 Salesforce 进行潜在客户跟踪。
  • 浏览 GitHub 存储库:访问我们的完整实现,其中包含分步指南、示例代码和部署说明,以便在您自己的 AWS 账户中构建此解决方案。

关于作者

Dani Mitchell

Dani Mitchell 是亚马逊云计算(AWS)的资深生成式 AI 解决方案架构师。他专注于利用 Bedrock AgentCore 和 Amazon Bedrock 帮助全球企业加速其生成式 AI 旅程。

Sergio Garcés Vitale

Sergio Garcés Vitale 是 AWS 的资深解决方案架构师,热衷于生成式 AI。他在电信行业拥有超过 10 年的经验,在那里他帮助构建了数据和可观测性系统。在过去的 5 年里,Sergio 专注于指导客户进行云采用,以及实施人工智能用例。

Akarsha Sehwag

Akarsha Sehwag 是 Amazon Bedrock AgentCore GTM 团队的生成式 AI 数据科学家。她在 AI/ML 方面拥有超过六年的专业知识,曾在生成式 AI、深度学习和计算机视觉领域为不同的客户群体构建了可投入生产的企业级解决方案。业余时间,她喜欢徒步、骑自行车或打羽毛球。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区