目 录CONTENT

文章目录

普及商业智能:BGL携手Claude Agent SDK和Amazon Bedrock AgentCore的实践之旅

Administrator
2026-02-04 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://aws.amazon.com/blogs/machine-learning/democratizing-business-intelligence-bgls-journey-with-claude-agent-sdk-and-amazon-bedrock-agentcore/

原文作者:Dustin Liu, Frank Tan, James Bland, James Luo, and Melanie Li


本文由 James Luo(来自 BGL)与我们共同撰写。

数据分析正成为 AI 智能体应用中影响深远的用例。根据 Anthropic 的《2026 年 AI 智能体报告》,60% 的组织将数据分析和报告生成列为最具影响力的智能体 AI 应用。65% 的企业将其视为首要任务。在实践中,企业面临两个常见挑战:

  • 缺乏技术知识的业务用户需要依赖数据团队进行查询,这既耗时又造成瓶颈。
  • 传统的文本到 SQL 解决方案无法提供一致且准确的结果。

与许多其他企业一样,BGL 在其数据分析和报告用例中也面临着类似的挑战。BGL 是领先的自我管理养老金(SMSF)管理解决方案提供商,旨在帮助个人管理其自身或客户退休储蓄的复杂合规和报告要求,服务于 15 个国家的 12,700 多个企业。BGL 的解决方案通过 400 多个分析表处理复杂的合规和财务数据,每个表代表一个特定的业务领域,例如汇总的客户反馈、投资表现、合规跟踪和财务报告。BGL 的客户和员工需要从这些数据中发掘见解。例如,“上个季度哪些产品的负面反馈最多?”或“向我展示高净值账户的投资趋势”。BGL 与 Amazon Web Services (AWS) 合作,使用托管在 Amazon Bedrock AgentCore 上的 Claude Agent SDK 构建了一个 AI 智能体。通过使用此 AI 智能体,业务用户可以通过自然语言检索分析见解,同时符合金融服务的安全和合规要求,包括会话隔离和基于身份的访问控制。

在这篇博文中,我们将探讨 BGL 如何使用 Claude Agent SDK 和 Amazon Bedrock AgentCore 构建其生产级 AI 智能体。我们将重点介绍 BGL 实施的三个关键方面:

  • 为什么构建强大的数据基础对于可靠的基于 AI 智能体的文本到 SQL 解决方案至关重要
  • BGL 如何利用 Claude Agent SDK 设计其 AI 智能体,以实现代码执行、上下文管理和领域专业知识
  • BGL 如何利用 AgentCore 在生产环境中提供理想的有状态执行会话,以实现更安全、可扩展的 AI 智能体。

为基于 AI 智能体的文本到 SQL 解决方案奠定坚实的数据基础

当工程团队为分析用例实施 AI 智能体时,一个常见的反模式是让智能体处理所有事情,包括理解数据库模式、转换复杂数据集、整理分析的业务逻辑和解释结果。AI 智能体很可能会产生不一致的结果,并且可能因错误地连接表、遗漏边缘情况或产生错误的聚合而失败。

BGL 利用其由 Amazon Athenadbt Labs 驱动的成熟的大数据解决方案,来处理和转换来自各种业务数据源的数 TB 的原始数据。提取、转换和加载(ETL)过程会构建分析表,每个表都旨在回答特定类别的业务问题。这些表是汇总的、非规范化的数据集(包含指标和摘要),它们是商业智能(BI)工具、AI 智能体和应用程序的业务就绪的单一事实来源。有关如何使用 Athena 和 dbt 构建无服务器数据转换架构的详细信息,请参阅《宝马集团如何使用 dbt 和 Amazon Athena 构建无服务器 TB 级数据转换架构》。

AI 智能体的作用是通过专注于解释用户的自然语言问题、将其翻译并针对结构良好的分析表生成 SQL SELECT 查询,来处理数据系统内部复杂的 ETL 过程。在需要时,AI 智能体会编写 Python 脚本来进一步处理结果并生成可视化。这种关注点分离显著降低了幻觉的风险,并带来了几项关键优势:

  • 一致性:数据系统以更确定的方式处理复杂的业务逻辑:连接、聚合和业务规则会提前由数据团队验证。AI 智能体的任务变得简单:解释问题并针对这些表生成基本的 SELECT 查询。
  • 性能:分析表已预先聚合并使用适当的索引进行了优化。智能体执行基本查询,而不是跨原始表执行复杂连接,即使对于大型数据集也能实现更快的响应时间。
  • 可维护性和治理:业务逻辑存在于数据系统中,而不是 AI 的上下文窗口中。这有助于确保 AI 智能体依赖与其他消费者(如 BI 工具)相同的单一事实来源。如果业务规则发生变化,数据团队会在 dbt 中更新数据转换逻辑,AI 智能体会自动使用反映这些更改的更新后的分析表。

“很多人认为 AI 智能体非常强大,可以跳过构建数据平台;他们希望智能体做所有事情。但那样无法获得一致且准确的结果。每一层都应该在适当的级别上解决复杂性。”

—— James Luo,BGL 数据与 AI 负责人

BGL 如何使用 Amazon Bedrock 中的 Claude Agent SDK 构建 AI 智能体

BGL 的开发团队一直使用由 Amazon Bedrock 驱动的 Claude Code 作为其 AI 编码助手。此集成使用临时、基于会话的访问来减轻凭证泄露的风险,并与现有身份提供商集成,以符合金融服务的合规性要求。有关集成详情,请参阅《Amazon Bedrock 中的 Claude Code 集成指南

通过日常使用 Claude Code,BGL 认识到其核心能力超出了编码范围。BGL 利用了它自主推理复杂问题、编写和执行代码以及与文件和系统交互的能力。Claude Agent SDK 将这些相同的智能体能力封装在 Python 和 TypeScript SDK 中,以便开发人员可以在 Claude Code 之上构建自定义 AI 智能体。对于 BGL 而言,这意味着他们可以构建一个分析 AI 智能体,该智能体具备:

  • 代码执行:智能体编写并运行 Python 代码来处理从分析表中返回的数据集并生成可视化
  • 自动上下文管理:长期运行的会话不会使令牌限制不堪重负
  • 沙盒执行:生产级隔离和权限控制
  • 模块化内存和知识:一个用于项目上下文的 CLAUDE.md 文件和用于产品线领域特定专业知识的 Agent Skills(智能体技能)

为什么代码执行对数据分析至关重要

分析查询通常返回数千行,有时甚至超过数兆字节的数据。标准的工具使用、函数调用和模型上下文协议(MCP)模式通常会将检索到的数据直接传递到上下文窗口中,这很快就会达到模型的上下文窗口限制。BGL 实施了一种不同的方法:智能体编写 SQL 以查询 Athena,然后编写 Python 代码以直接在其文件系统中处理 CSV 文件结果。这使得智能体能够处理大型结果集、执行复杂的聚合以及生成图表,而不会达到上下文窗口限制。您可以了解有关代码执行模式的更多信息,请参阅使用 MCP 进行代码执行:构建更高效的智能体

模块化知识架构

为了处理 BGL 多样化的产品线和复杂的领域知识,该实施采用了模块化方法,其中两种关键配置类型可以无缝协作。

CLAUDE.md(项目上下文)

CLAUDE.md 文件为智能体提供全局上下文——项目结构、环境配置(测试、生产等),以及最关键的——如何执行 SQL 查询。它定义了哪些文件夹存储中间结果和最终输出,确保文件着陆在用户可以访问的定义文件路径中。下图显示了 CLAUDE.md 文件的结构:

This image displays a technical documentation file named CLAUDE.md that outlines the hierarchical structure of a data analytics project. The document begins with three comment sections describing the project context, setup instructions, and data folder construction. The main content shows a numbered list explaining three file types found in each analytics table: schema.md for schema descriptions and data dictionaries, sample_data.csv for sample data, and statistics.md for data statistics. Below this, an ASCII tree diagram illustrates the folder hierarchy starting with a data directory, containing multiple databases labeled as mart layer, including database_1 and database_2. Each database contains analytics tables such as analytics_table_1, analytics_table_2, and analytics_table_3. Each analytics table consistently includes the three file types mentioned above. Ellipses indicate additional databases and tables follow the same pattern.

SKILL.md(产品领域专业知识)

BGL 使用 SKILL.md 配置文件按产品线组织其智能体领域知识。每项技能都充当特定产品的专业数据分析师。例如,BGL CAS 360 产品有一项名为CAS360 数据分析智能体的技能,该技能处理公司和信托管理以及 ASIC 合规性对齐;而 BGL 的 Simple Fund 360 产品 有一项名为Simple Fund 360 数据分析智能体的技能,该技能配备了 SMSF 管理和合规相关领域技能。SKILL.md 文件定义了三件事:

  • 触发时机:哪些类型的问题应激活此技能
  • 要使用或映射的表:对数据文件夹中相关分析表的引用(如前图所示)
  • 如何处理复杂场景:如果需要,针对多表查询或特定业务问题的分步指南

通过使用 SKILL.md 文件,智能体可以动态发现并加载正确的技能,以获取针对相应任务的领域特定专业知识。

  • 统一上下文:当触发一项技能时,Claude Agent SDK 会动态地将其专业指令与全局 CLAUDE.md 文件合并到一个提示中。这使得智能体能够在应用项目范围标准(例如,始终保存到磁盘)的同时,利用领域特定的知识(例如,将用户问题映射到一组表)。
  • 渐进式发现:并非所有技能都需要一次性加载到上下文窗口中。智能体首先读取查询以确定需要触发哪个技能。它会加载技能主体和引用,以了解需要哪些分析表的元数据。然后它会进一步探索相应的数据文件夹。这可以保持上下文使用的效率,同时提供全面的覆盖。
  • 迭代改进:如果 AI 智能体因缺乏新的领域知识而无法处理某些业务知识,团队将从用户那里收集反馈,识别差距,并通过人机协作流程将新知识添加到现有技能中,从而对技能进行迭代更新和改进。

This technical architecture diagram illustrates an Agent Virtual Machine system designed for AI automation and skill management. The diagram is organized into two main sections: At the top level, the system provides two scripting execution environments: Bash for shell command execution and Python for running Python scripts. These environments enable the agent to perform various computational tasks. The lower section displays the file system architecture, represented by a light blue container. Within this file system, skills are organized using a standardized directory structure following the pattern "skills/[skillname]360/". Three specific skill modules are shown: skills/sf360/ containing a SKILL.md documentation file and a references subdirectory skills/cas360/ containing a SKILL.md documentation file and a references subdirectory skills/smartdocs360/ containing a SKILL.md documentation file and a references subdirectory An ellipsis notation indicates additional skill directories follow the same organizational pattern. Each skill module maintains consistent structure with documentation (SKILL.md) and supporting reference materials stored in dedicated subdirectories. This modular architecture enables the AI agent system to access, execute, and manage multiple capabilities programmatically, with each skill packaged alongside its documentation and resources for efficient automation workflows.

如前图所示,智能体技能是按产品线组织的。每个产品文件夹包含一个 SKILL.md 定义文件和一个 references 目录,其中包含更多领域知识和支持材料,智能体可按需加载。

有关 Anthropic Agent Skills 的详细信息,请参阅 Anthropic 的博文《使用 Agent Skills 为现实世界做好准备的智能体

解决方案高层架构

为了提供更安全、可扩展的文本到 SQL 体验,BGL 使用 Amazon Bedrock AgentCore 来托管 Claude Agent SDK,同时将数据转换保留在现有的的大数据解决方案中。

AWS Cloud Architecture with dbt, Amazon Athena, and Claude Agent Integration Image Description This architecture diagram illustrates an AWS Cloud-based data pipeline system that integrates multiple AWS services with dbt and Slack to enable intelligent data processing and AI-powered interactions. Components The diagram shows seven key components within the AWS Cloud environment: dbt (data build tool): A data transformation tool positioned on the left side, represented by its distinctive logo Amazon Athena: AWS

上图说明了高层架构和工作流程。分析表每天使用 Athena 和 dbt 预先构建,作为单一事实来源。典型的用户交互遵循以下阶段:

  1. 用户请求:用户使用 Slack 提出业务问题(例如,上个季度哪些产品的负面反馈最多?)。
  2. 模式发现和 SQL 生成:智能体使用技能识别相关表并编写 SQL 查询。
  3. SQL 安全验证:为帮助防止意外的数据修改,安全层只允许 SELECT 查询并阻止 DELETE、UPDATE 和 DROP 操作。
  4. 查询执行:Athena 执行查询并将结果存储在 Amazon Simple Storage Service (Amazon S3) 中。
  5. 结果下载:智能体将生成的 CSV 文件下载到 AgentCore 上的文件系统中,完全绕过上下文窗口以避免令牌限制。
  6. 分析和可视化:智能体编写 Python 代码来分析 CSV 文件并根据业务问题生成可视化或精炼的数据集。
  7. 响应传递:最终的见解和可视化被格式化并返回给 Slack 中的用户。

为什么使用 Amazon Bedrock AgentCore 托管 Claude Agent SDK

部署执行任意 Python 代码的 AI 智能体需要大量的基础设施考虑。例如,您需要隔离措施,以帮助确保不同会话之间不会发生数据或凭证的交叉访问。Amazon Bedrock AgentCore 提供完全托管的、有状态的执行会话,每个会话都有自己隔离的微型虚拟机(microVM),具有独立的 CPU、内存和文件系统。当会话结束时,微型虚拟机完全终止并清除内存,有助于确保没有残留物保留到后续会话中。BGL 发现此服务特别有价值:

  • 有状态执行会话:AgentCore 维护会话状态长达 8 小时。用户可以与智能体进行持续对话,而无需丢失上下文即可回顾先前的查询。
  • 框架灵活性:它是框架无关的。它支持部署 AI 智能体,例如 Strands Agents SDK、Claude Agent SDK、LangGraphCrewAI,只需几行代码即可完成。
  • 符合安全最佳实践:它提供会话隔离、VPC 支持、AWS Identity and Access Management (IAM) 或基于 OAuth 的身份验证,以促进大规模、合规性强的智能体操作。
  • 系统集成:这是一个前瞻性的考虑因素。

“它有一个网关、内存、浏览器工具,一个围绕它的整个生态系统。我知道 AWS 正在向这个方向投入,所以我们现在构建的一切都可以与这些服务集成。”

—— James Luo,BGL 数据与 AI 负责人。

BGL 已经在计划集成 AgentCore Memory,用于存储用户偏好和查询模式。

成果与影响

对于 BGL 的 200 多名员工来说,这代表了他们提取商业智能方式的重大转变。产品经理现在可以立即验证假设,而无需等待数据团队。合规团队可以在不学习 SQL 的情况下发现风险趋势。客户成功经理可以在客户电话会议期间实时拉取特定账户的分析数据。这种数据访问的民主化有助于将分析从瓶颈转变为竞争优势,从而在整个组织中实现更快的决策制定,同时让数据团队能够专注于战略性举措,而不是一次性查询请求。

结论与关键要点

BGL 的实践之旅证明了如何将强大的数据基础与智能体 AI 相结合,从而实现商业智能的民主化。通过使用 Amazon Bedrock AgentCore 和 Claude Agent SDK,BGL 构建了一个更安全、可扩展的 AI 智能体,使员工能够利用他们的数据来回答业务问题。以下是一些关键要点:

  • 投资于强大的数据基础:准确性始于强大的数据基础。通过使用数据系统和数据管道来处理复杂的业务逻辑(连接和聚合),智能体可以专注于基本、可靠的逻辑。
  • 按领域组织知识:使用 Agent Skills 来封装领域特定专业知识(例如,税务法规投资表现)。这使上下文窗口保持干净和可管理。此外,建立反馈循环:持续监控用户查询以识别差距,并迭代更新这些技能。
  • 使用代码执行进行数据处理:避免使用 LLM 上下文来处理大型数据集。相反,指示智能体编写和执行代码来筛选、聚合和可视化数据。
  • 选择有状态、基于会话的基础设施来托管智能体:会话式分析需要持久的上下文。Amazon Bedrock AgentCore 通过提供内置的状态持久性(最长 8 小时会话),简化了这一点,从而无需在无状态计算之上构建自定义状态处理层。

如果您准备好为您的组织构建类似的功能,请通过探索 Claude Agent SDK 和对在 Amazon Bedrock AgentCore 运行时上部署 Claude Agent SDK 的简短演示来开始。如果您有类似的用例或需要支持架构设计,请联系您的 AWS 客户团队。

参考资料:


关于作者

Dustin Liu 是 AWS 的解决方案架构师,专注于支持金融服务和保险 (FSI) 初创公司和 SaaS 公司。他拥有跨越数据工程、数据科学和机器学习的多元化背景,热衷于利用 AI/ML 推动创新和业务转型。

Melanie Li,博士,是位于澳大利亚悉尼的 AWS 高级生成式 AI 专家解决方案架构师,她的重点是与客户合作,利用最先进的 AI 和机器学习工具构建解决方案。她一直积极参与亚太及日本地区(APJ)的多个生成式 AI 项目,利用大型语言模型 (LLM) 的力量。在加入 AWS 之前,李博士曾在金融和零售行业担任数据科学职位。

Frank Tan 是 AWS 的高级解决方案架构师,对应用 AI 特别感兴趣。他拥有产品开发背景,致力于弥合技术与业务成功之间的鸿沟。

James Luo 是 BGL Corporate Solutions 的数据与 AI 负责人,BGL 是全球领先的会计师和金融专业人士合规软件提供商。自 2008 年加入 BGL 以来,James 从开发人员到架构师,再到目前的领导职位,领导了数据平台和 Roni AI 智能体计划。2015 年,他组建了 BGL 的大数据团队,并在 SMSF 行业实施了第一个深度学习模型(2017 年),该模型目前每年处理超过 2.5 亿笔交易。他曾在 Big Data & AI World 和 AWS Summit 上发表演讲,BGL 的 AI 工作也在多项 AWS 案例研究中得到介绍。

James Bland 博士是一位技术领导者,在规模化推动 AI 转型方面拥有 30 多年的经验。他拥有计算机科学博士学位,专注于机器学习,并在 AWS 领导战略性 AI 项目,使企业能够采用 AI 驱动的开发生命周期和智能体能力。Bland 博士带头开展了 AI-SDLC 项目,撰写了关于 SDLC 中生成式 AI 的综合指南,并帮助企业架构生产规模的 AI 解决方案,从根本上改变组织在 AI 优先世界中的运作方式。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区