目 录CONTENT

文章目录

告诉我何时——构建能够等待、监控和执行的智能体

Administrator
2025-10-29 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://www.microsoft.com/en-us/research/blog/tell-me-when-building-agents-that-can-wait-monitor-and-act/

原文作者:Microsoft Research


我们很高兴地宣布推出“告诉我何时”(Tell Me When, TMW),这是一个用于构建能够等待、监控和执行操作的新型智能体(Agent)的框架。传统上,大型语言模型(LLM)智能体通常被设计为在单一、连贯的推理链中执行任务,这种方式在处理需要长期状态监控和时间驱动操作的复杂场景时存在局限性。

智能体面临的挑战

目前的LLM驱动的智能体,例如那些使用规划、思维链(Chain-of-Thought)或工具调用的智能体,通常需要不断地被提示和监控。它们本质上是同步的、一步到位的系统,不适合需要等待外部事件或长时间后台处理的任务。我们发现,许多现实世界的复杂任务,比如等待邮件到达监控系统日志定期执行维护任务,或者在特定条件满足时发出警报,都超出了这些智能体的能力范围。

这些场景通常需要智能体具备以下能力:

  • 等待(Waiting): 智能体需要有能力暂停执行,直到满足特定的外部条件或时间点。
  • 监控(Monitoring): 需要持续观察环境状态,而非仅仅对单一请求做出反应。
  • 执行(Acting): 在满足预设条件时,智能体应能自动触发并执行一个或多个操作。

TMW 框架如何解决问题

TMW框架通过引入“监控器”(Monitors)和“动作触发器”(Action Triggers)的概念,将等待和监控逻辑与核心的LLM推理过程解耦。这使得智能体能够以一种更异步、更健壮的方式运行。

架构概述

TMW系统主要由三个核心组件构成:

  1. Agent Core (LLM): 负责核心的规划和任务执行。
  2. Monitor Modules: 这些模块负责持续检查环境的特定状态或外部事件。它们可以基于时间、API调用结果、数据库变化或用户输入来设计。
  3. Action Triggers: 当监控器检测到预设条件满足时,触发器会将一个结构化的、高优先级的信息传递给Agent Core,指示其执行特定动作。

关键在于,监控和等待过程是独立于LLM核心推理循环运行的。LLM只需要在被唤醒时处理触发的动作指令,而不是持续消耗计算资源进行空等。

TMW 框架架构图,展示了 Agent Core、Monitor Modules 和 Action Triggers 之间的异步交互。

异步和时间管理

TMW 引入了对“时间”这一重要维度的显式管理。智能体可以被赋予“暂停并等待直到特定时间”的指令,或者“每隔X时间检查Y状态”的指令。这种机制极大地扩展了智能体可处理的任务范围。

“我们不再需要将‘等待五分钟’编码为‘生成一个等待五分钟的回复’,而是让系统在底层优雅地处理时间调度,直到五分钟后,再将任务交还给智能体执行后续步骤。”

应用案例与实验结果

我们在多个领域测试了TMW框架的能力,包括自动化IT运维、个人日程管理和数据管道协调。

案例一:跨时区会议协调

一个智能体被要求协调一个包含欧洲、亚洲和北美参与者的会议。它需要根据参与者开放的时间段(通过日历API查询),等待所有日历都显示空闲后,自动发送最终邀请。

使用传统方法,智能体需要反复调用日历API,直到所有人都空闲,效率低下且易出错。使用TMW,智能体设置了多个监控器:一个监控所有参与者的可用性,并在所有人都可用时触发“发送邀请”动作。

案例二:持续日志监控与警报

另一个智能体被部署以监控一个模拟的服务器日志流。它被指示在检测到连续 10 次“错误代码 500”时,自动执行重启脚本。

TMW的监控器持续扫描日志流。一旦连续错误计数达到10,动作触发器立即启动,将包含“执行重启脚本”的指令发送给核心智能体。这比基于定时轮询的传统监控方案更为及时和精确。

实验表明,TMW 框架在处理需要异步交互和时间依赖的任务时,成功率提高了 25%,同时显著降低了不必要的LLM调用次数,从而节省了计算资源。

总结与展望

“告诉我何时”(TMW)代表了智能体设计从纯粹的、即时的推理转向反应式、事件驱动架构的重要一步。通过将监控和等待能力集成到智能体生命周期中,我们正在构建更加自主和实用的AI代理。

我们相信,这种能力对于构建下一代复杂、自主运行的AI助手至关重要。TMW 的设计是模块化和可扩展的,允许开发者轻松集成自定义的监控源和动作库。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区