告诉我：构建能够等待、监控和执行的智能体-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.microsoft.com/en-us/research/blog/tell-me-when-building-agents-that-can-wait-monitor-and-act/

原文作者：Microsoft Research

在构建能够与环境进行长期交互的智能体时，一个常见的挑战是如何让它们知道何时需要等待、何时需要监控环境的变化，以及何时需要采取行动。许多当前的AI智能体设计侧重于一步到位的决策或短期的规划，但在需要时间延迟或外部反馈的任务中往往表现不佳。

等待、监控与行动：构建更智能的代理

我们（微软研究院的团队）正在研究如何让智能体更好地处理需要“等待”和“监控”的场景。在现实世界中，许多任务不是即时完成的，而是需要持续观察环境直到满足特定条件才触发下一步操作。例如，等待网页加载完成、等待文件上传、或者等待用户输入。

传统的智能体在面对这种不确定性时，可能会陷入无限循环地检查状态，或者过早地执行下一步，导致任务失败。

为了解决这个问题，我们提出了一种新颖的范式，可以概括为“告诉我”（Tell Me When）。这个机制的核心思想是：

这种方法将“等待”视为一种可管理的、可预测的状态，而不是一个需要智能体不断消耗计算资源的模糊任务。

这种“告诉我”的架构在需要与外部系统或用户进行异步交互的场景中尤其有用。我们发现，通过明确区分“行动阶段”和“监控/等待阶段”，智能体的鲁棒性得到了显著提高。

具体来说，我们关注了以下几类任务：

通过这种设计，我们希望构建的智能体不仅能高效地执行已知的任务序列，还能在复杂的、非确定性的环境中表现出更高级的适应能力和可靠性。

这项工作是迈向构建真正能够自主运作的、面向计算机使用的AI代理的关键一步。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。