目 录CONTENT

文章目录

GPT-5.4 震撼登场:专为专业工作负载打造的终极 AI 模型

Administrator
2026-04-03 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://openai.com/index/introducing-gpt-5-4

原文作者:OpenAI


今天,我们正式发布了 GPT‑5.4,该模型现已通过 ChatGPT(以 GPT‑5.4 Thinking 模式)、API 及 Codex 提供服务。作为 OpenAI 目前针对专业化工作负载能力最强、效率最高的前沿模型,GPT‑5.4 集成了顶尖的推理、编程及智能体工作流能力。

知识型工作的新基准

GPT‑5.4 在处理电子表格、演示文稿和文档等专业任务方面表现卓越。在 GDPval 职业能力测试中,GPT‑5.4 在 83.0% 的案例中达到了持平或更优水平,刷新了记录。此外,其在投行分析师水平的电子表格建模测试中得分高达 87.5%,显著降低了事实错误率。

GPT-5.2 与 GPT-5.4 电子表格输出效果对照示例

计算机使用与视觉突破

GPT‑5.4 是我们首款原生支持计算机使用能力的通用模型,能够跨应用程序执行复杂工作流程。在 OSWorld-Verified 基准测试中,其成功率达到 75.0%,超越了人类表现。模型支持高达 1M Token 的上下文窗口,并引入了“原始 (original)”图像输入级别,极大提升了高分辨率图像的定位与解析精度。

编码与智能体工作流

通过整合 GPT‑5.3‑Codex 的优势,GPT‑5.4 在编程任务中不仅表现更果断,还通过工具搜索功能优化了智能体在庞大生态系统中的操作效率。数据显示,“工具搜索”配置将总 Token 使用量降低了 47%。此外,通过优先处理服务,开发者可以在 API 中获得更快的响应速度,满足对延迟敏感的应用需求。

可控性与安全性

为了提升用户体验,ChatGPT 中的 GPT‑5.4 Thinking 现可预先提供其思考计划,并支持在运行中途调整方向,减少了额外往复沟通的需要。在安全性方面,模型延续了严格的防护措施,并新增了开源指标 CoT 可控性 评估,确保推理逻辑的透明性与安全性。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区