目 录CONTENT

文章目录

从模型到智能体:为 Responses API 配备计算机环境

Administrator
2026-04-08 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/equip-responses-api-computer-environment

原文作者:Bo Xu、Danny Zhang 和 Rohit Arunachalam


我们目前正经历一场变革:从使用擅长特定任务的模型 (Model),转向使用能够处理复杂工作流的智能体 (Agent)。通过提示模型,你只能调用它已经学到的能力;但如果为模型提供一个计算机环境,就能实现更广泛的应用场景,例如运行服务、调用 API 请求数据,或生成电子表格和报告等更具实用价值的产物。

与其让开发者自行构建执行环境,我们直接打造了必要的组件,为 Responses API 配备了计算机环境,从而可靠地执行现实世界中的任务。

Shell 工具

一个优秀的智能体工作流始于一个紧密的执行循环:模型提出操作建议,平台执行该操作,结果再反馈给下一步。Shell 工具极大增强了模型的能力:它通过命令行与计算机交互,预装了 grepcurlawk 等成熟工具。与仅能运行 Python 代码的解释器不同,Shell 工具支持运行 Go、Java 或启动 NodeJS 服务器,灵活性更高。

Shell 工具示意图

Responses API 通过编排器 (Orchestrator) 将模型输出、工具调用与结果反馈进行循环连接。当模型决定执行 Shell 命令时,API 服务会将命令转发给容器运行时,并实时流式传输输出结果,使模型能够进行持续推理。

容器上下文与安全性

容器不仅是运行命令的场所,更是模型的运行上下文。我们提供了三层核心支持:

  • 文件系统:通过容器和文件 API,模型可以结构化地上传、组织和管理资源,避免了将庞大的数据直接塞入提示词导致的上下文溢出。
  • 数据库:建议将结构化数据存入 SQLite 等数据库,模型按需查询,效率更高。
  • 受控网络访问:为防止信息泄露,我们构建了边车出口代理 (Sidecar Egress Proxy)。所有出站请求均经过白名单校验,并使用域名作用域的机密注入,确保模型在不直接接触真实凭据的情况下完成身份验证。

智能体技能与自动压缩

为了解决任务重叠带来的资源浪费,智能体技能 (Agent Skills) 将多步工作流封装为可重用的构建模块。开发者可上传版本化的技能包,模型在运行时会自动加载这些逻辑。

针对长耗时任务可能占满上下文窗口的问题,我们引入了原生压缩 (Native Compaction) 功能。模型能够分析对话状态并生成高价值的压缩项,确保在超长会话中依然保持逻辑连贯性。

我们期待看到开发者利用这一组基础原语构建出更多精彩内容。未来,语言模型不应仅仅是生成内容的工具,而应成为处理复杂现实任务的得力助手。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区