📢 转载信息
原文链接:https://openai.com/index/equip-responses-api-computer-environment
原文作者:Bo Xu、Danny Zhang 和 Rohit Arunachalam
我们目前正经历一场变革:从使用擅长特定任务的模型 (Model),转向使用能够处理复杂工作流的智能体 (Agent)。通过提示模型,你只能调用它已经学到的能力;但如果为模型提供一个计算机环境,就能实现更广泛的应用场景,例如运行服务、调用 API 请求数据,或生成电子表格和报告等更具实用价值的产物。
与其让开发者自行构建执行环境,我们直接打造了必要的组件,为 Responses API 配备了计算机环境,从而可靠地执行现实世界中的任务。
Shell 工具
一个优秀的智能体工作流始于一个紧密的执行循环:模型提出操作建议,平台执行该操作,结果再反馈给下一步。Shell 工具极大增强了模型的能力:它通过命令行与计算机交互,预装了 grep、curl 和 awk 等成熟工具。与仅能运行 Python 代码的解释器不同,Shell 工具支持运行 Go、Java 或启动 NodeJS 服务器,灵活性更高。
Responses API 通过编排器 (Orchestrator) 将模型输出、工具调用与结果反馈进行循环连接。当模型决定执行 Shell 命令时,API 服务会将命令转发给容器运行时,并实时流式传输输出结果,使模型能够进行持续推理。
容器上下文与安全性
容器不仅是运行命令的场所,更是模型的运行上下文。我们提供了三层核心支持:
- 文件系统:通过容器和文件 API,模型可以结构化地上传、组织和管理资源,避免了将庞大的数据直接塞入提示词导致的上下文溢出。
- 数据库:建议将结构化数据存入 SQLite 等数据库,模型按需查询,效率更高。
- 受控网络访问:为防止信息泄露,我们构建了边车出口代理 (Sidecar Egress Proxy)。所有出站请求均经过白名单校验,并使用域名作用域的机密注入,确保模型在不直接接触真实凭据的情况下完成身份验证。
智能体技能与自动压缩
为了解决任务重叠带来的资源浪费,智能体技能 (Agent Skills) 将多步工作流封装为可重用的构建模块。开发者可上传版本化的技能包,模型在运行时会自动加载这些逻辑。
针对长耗时任务可能占满上下文窗口的问题,我们引入了原生压缩 (Native Compaction) 功能。模型能够分析对话状态并生成高价值的压缩项,确保在超长会话中依然保持逻辑连贯性。
我们期待看到开发者利用这一组基础原语构建出更多精彩内容。未来,语言模型不应仅仅是生成内容的工具,而应成为处理复杂现实任务的得力助手。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区