汤森路透如何利用 Amazon Bedrock AgentCore 构建一个智能体驱动的平台工程中心-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-built-an-agentic-platform-engineering-hub-with-amazon-bedrock-agentcore/

原文作者：Naveen Pollamreddi, Seth Krause, Pratip Bagchi, and Sandeep Singh

本文由 Thomson Reuters 的 Naveen Pollamreddi 和 Seth Krause 共同撰写。

汤森路透 (Thomson Reuters, TR) 是一家领先的人工智能和技术公司，致力于提供可信赖的内容和工作流自动化解决方案。TR 拥有超过 150 年的专业经验，在法律、税务、会计、风险、贸易和媒体等领域提供必不可少的解决方案，以应对快速变化的世界。人工智能在 TR 中扮演着关键角色。它嵌入在 TR 创建、增强、连接和向客户交付可信信息的方式中，为全球专业人士使用的产品提供动力。TR 的人工智能使专业人士能够利用专业级 AI 来化解复杂的挑战。

本文将介绍 TR 的平台工程团队——一个负责 TR 服务可用性的全球分布式团队——如何通过使用 Amazon Bedrock AgentCore，将运营工作从手动流程转变为自动化的智能体系统，从而提高了其运营生产力。

业务挑战

平台工程团队在为内部客户规模化提供无缝的自助服务体验方面面临着严峻的挑战，这些服务涉及数据库管理、信息安全和风险管理 (ISRM) 操作、着陆区维护、基础设施配置、密钥管理、持续集成和部署 (CI/CD) 管道编排以及合规性自动化等运营活动。在 TR，平台工程团队通过提供必要的云基础设施和赋能服务（包括云账户配置和数据库管理）来支持多个业务线。然而，手动流程和运营任务需要团队之间反复协调，导致了延误，从而减慢了创新步伐。

TR 的杰出工程师 Naveen Polalmreddi 表示：“我们的工程师花费了大量时间回答相同的问题并在不同团队中执行相同的流程。” “我们需要一种方法来自动化这些交互，同时保持我们的安全和合规标准。”

当前状况

平台工程团队为 TR 内部的多个产品团队（包括产品工程和服务管理）提供服务。这些团队将他们内部的自研解决方案作为服务来使用，以便在 AWS 服务上大规模构建和运行应用程序。随着时间的推移，这些服务不仅作为工具提供，还通过 TR 的内部流程提供，这些流程遵循 ITIL（IT 基础架构库）标准，并使用第三方软件即服务 (SaaS) 系统。

其中一些服务依赖于人工来执行预定义的一系列步骤，并且这些步骤会重复执行多次，这造成了对工程师的重大依赖，需要他们对多个应用程序重复执行相同的任务。当前的流程是半自动化的，并且存在以下特点：

重复性高且劳动密集——由于工作流程的性质和多团队协作模式，这些操作流程往往劳动密集且重复性高。平台工程团队花费了大量时间处理那些没有区分度的繁重工作。
价值实现时间更长——由于流程的相互依赖性，这些操作工作流程不是完全自主的，与完全自动化的流程相比，实现价值所需的时间更长。
资源和成本密集——手动执行需要专门的工程资源，这些资源的时间本可以更好地用于创新，而不是重复性任务。每个操作请求都会消耗跨多个团队的工程师工时用于协调、执行和验证。

平台工程团队正在通过构建自主的智能体解决方案来解决这个问题，该方案使用跨越多个服务领域和组的专业化智能体。云账户配置智能体根据内部标准自动化新云账户的创建和配置，处理设置组织单位、应用安全策略和配置基线网络等任务。数据库补丁智能体管理端到端的数据库补丁生命周期和版本升级。网络服务智能体处理网络配置请求，例如 VPC 设置、子网分配以及环境之间的连接建立。架构审查智能体协助根据最佳实践、安全要求和合规标准评估建议的架构，提供自动化的反馈和建议。AgentCore 作为这些智能体的基础编排层，提供了构建、部署和扩展企业级 AI 智能体所需的完整基础架构，而无需从头开始构建该基础架构。AgentCore 提供了核心的智能体能力，支持智能决策、自然语言理解、工具调用和智能体间 (A2A) 通信。

解决方案概述

TR 的平台工程团队在构建此解决方案时，将可扩展性、可扩展性和安全性作为核心原则，并设计该解决方案，以便非技术用户可以快速创建和部署由 AI 驱动的自动化。该架构专为广泛的企业受众设计，使得业务用户可以通过基本的自然语言请求与专业化智能体进行交互，而无需了解底层的技术复杂性。TR 选择 Amazon Bedrock AgentCore，是因为它提供了构建、部署和规模化运行企业级 AI 智能体所需的完整基础架构，而无需从头开始构建该基础架构。平台工程团队获得了使用其首选框架进行创新的灵活性，同时设计其自主智能体以具备企业级的安全性、可靠性和可扩展性——这对大规模管理生产运营工作流程至关重要。

下图说明了该解决方案的架构：

TR 使用 AgentCore 构建了一个由 AI 驱动的平台工程中心。该解决方案包括：

一个用于更安全智能体交互的自定义 Web 门户
一个中心编排智能体，用于路由请求和管理交互
多个处理专业化任务（如 AWS 账户配置和数据库补丁）的服务特定智能体
一个用于敏感操作的人机循环验证服务

TR 决定使用 AgentCore，因为它帮助开发人员通过完全托管的服务从原型快速过渡到生产，这些服务最大限度地减少了基础设施复杂性，并允许使用不同的框架、模型和工具构建 AI 智能体，同时完全控制智能体的运行方式及其与现有系统的集成方式。

解决方案工作流程

团队使用以下工作流程来开发和部署智能体 AI 系统。

发现和架构规划：评估现有的 AWS 资源和代码库，以设计一个包含 AgentCore 的全面解决方案，重点关注服务目标和集成要求。
核心开发和迁移：通过将现有解决方案迁移到 AgentCore 的同时构建 TRACK（部署引擎），采用双轨方法，从而实现快速的智能体创建。实施了一个注册系统作为智能体与编排器之间的模块化桥梁。
系统增强和部署：完善编排器的功能，开发直观的用户体验 (UX)，并执行团队入职流程以部署新的智能体系统。

构建编排智能体

TR 的平台工程团队使用 LangGraph 框架将其编排服务（命名为 Aether）设计为一个模块化系统。编排器从其智能体注册表中检索上下文，以确定每种情况下的合适智能体。当需要智能体执行操作时，编排器会进行工具调用，以编程方式从注册表中填充数据，有助于防止潜在的提示注入攻击，并促进端点之间更安全的通信。

为了在保持系统无状态的同时维护对话上下文，编排器在对话和用户级别都集成了 AgentCore 内存服务的功能。短期记忆维护单个对话中的上下文，而长期记忆则跟踪用户偏好和随时间变化的交互模式。这种双重记忆方法允许系统从过去的交互中学习并避免重复先前的错误。

服务智能体开发框架

平台工程团队开发了自己的框架 TR-AgentCore-Kit (TRACK)，以简化跨组织的智能体部署。TRACK 是一个自研解决方案，它利用了 Bedrock AgentCore Starter Toolkit 的定制版本。团队定制了这个工具包，以满足 TR 的特定合规性要求，其中包括资产识别标准和资源标记标准。该框架处理与 AgentCore Runtime 的连接、工具管理、AgentCore Gateway 连接和基线智能体设置，因此开发人员可以专注于实现业务逻辑，而不是处理基础设施问题。AgentCore Gateway 为开发人员提供了一种直接且更安全的方式，以规模化地构建、部署、发现和连接到工具。TRACK 还通过将智能体卡部署到自定义构建的 A2A 注册表中，来处理服务智能体向 Aether 环境的注册。通过将智能体卡部署到注册表中，由服务团队构建的智能体完全入职的过程可以继续使该智能体可供总体的编排器使用，TRACK 通过一个软件包提供了部署到 AWS 和注册到自定义构建的服务的能力，从而为开发人员提供了无缝的流程。

智能体发现和注册系统

为了实现无缝的智能体发现和通信，TR 使用 Amazon DynamoDB 和 Amazon API Gateway 实施了一个自定义的 A2A 解决方案。该系统支持跨账户智能体调用，这对于他们的模块化架构至关重要。注册过程通过 TRACK 项目进行，以便团队可以直接向编排服务注册其智能体。A2A 注册表为审计目的维护了完整的智能体版本历史记录，并且要求在允许新智能体进入生产环境之前进行人工验证。这种治理模式有助于符合 TR 的 ISRM 标准，同时为未来的扩展提供了灵活性。

Aether Web 门户集成

团队使用 React 开发了一个 Web 门户，托管在 Amazon Simple Storage Service (Amazon S3) 上，为智能体交互提供了一个更安全、更直观的界面。该门户根据用户权限对用户进行身份验证，并提供对基于用户权限的智能体流程的访问。这种方法有助于确保只有授权人员才能访问敏感操作，例如 AWS 账户配置或数据库补丁。

人机循环验证服务

该系统包括 Aether Greenlight，这是一个验证服务，可确保关键操作得到适当的人工监督。该服务超越了基本的请求者批准，允许初始对话之外的团队成员参与验证过程。该系统维护了批准和操作的完整审计跟踪，支持 TR 的合规性要求。

成果

通过在 AgentCore 上构建自助式智能体系统，TR 实施了利用 AI 编排来端到端处理复杂操作工作流程的自主智能体。

生产力和效率

通过对日常任务的智能自动化，实现了15 倍的生产力提升
首次发布即实现了70% 的自动化率，大幅减少了手动工作量
智能体全天候执行可重复的运行手册，实现持续的可靠性

速度和敏捷性

更快的价值实现时间：通过自动化环境设置、策略执行和日常操作，加速了产品交付
自助服务工作流程：通过清晰的标准和铺设好的工具为团队赋能

安全性和合规性

更强的安全态势：默认应用了防护栏和数据库补丁
人机循环批准：在自动化验证更改的同时保持了监督

成本和资源优化

更好的成本效益：自动化基础设施使用优化
战略性人才分配：让工程团队可以专注于最高优先级、高价值的工作
减少操作困扰：通过标准化消除了重复性任务和差异性

开发人员体验

提高满意度：通过直观的自助服务功能简化了工作流程
一致的标准：为其他团队采纳和扩展建立了可重复的模式

结论

本文介绍的智能体系统建立了一个可复制的模式，组织内各团队都可以使用它来采用类似的自动化功能，从而对运营卓越性产生倍增效应。Aether 项目旨在通过消除手动执行可自动化任务的需要来改善工程师的体验，从而支持进一步的创新和创造性思维。随着 Aether 的不断改进，该团队希望该模式能被更广泛地采用，开始协助平台工程以外的团队实现全公司的生产力突破，巩固 TR 在人工智能时代作为先驱者的地位。

通过使用 Amazon Bedrock AgentCore，TR 将其平台工程运营从手动流程转变为由 AI 驱动的自助服务中心。这种方法不仅提高了效率，还加强了安全和合规性控制。

准备好变革您的平台工程运营了吗：

探索 AgentCore
探索 AgentCore 文档
如需其他用例，请探索基于 Notebook 的教程

关于作者

Naveen Pollamreddi 是汤森路透平台工程团队的一名杰出工程师，负责推动云基础设施服务的智能体 AI 战略。

Seth Krause 是汤森路透平台工程计算团队的云工程师。自加入公司以来，他一直致力于架构和实施增强全公司生产力的生成式 AI 解决方案。Seth 专注于构建云原生微服务，目前重点是将 AI 功能集成到企业工作流程中。

Pratip Bagchi 是亚马逊网络服务 (AWS) 的企业解决方案架构师。他热衷于帮助客户推动 AI 采用和创新，以释放业务价值和推动企业转型。

Sandeep Singh 是亚马逊网络服务 (AWS) 的高级生成式 AI 数据科学家，致力于帮助企业利用生成式 AI 进行创新。他专注于生成式 AI、机器学习和系统设计。他已成功交付了最先进的 AI/ML 驱动的解决方案，用于解决不同行业的复杂业务问题，优化效率和可扩展性。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

汤森路透如何利用 Amazon Bedrock AgentCore 构建一个智能体驱动的平台工程中心