📢 转载信息
原文作者:Rebecca Bellan
OpenAI 正在推出新版本的 ChatGPT Images,承诺在指令遵循、精确编辑方面有所改进,并且图像生成速度最高可提升 4 倍。
这款被称为 GPT Image 1.5 的新模型,自周二起向所有 ChatGPT 用户和 API 开放。这是继 OpenAI 首席执行官 Sam Altman 上个月在泄露的内部备忘录中宣布“红色警报”之后,与谷歌 Gemini 竞争的最新升级。该备忘录详细说明了 OpenAI 在谷歌发布其最新的旗舰模型 Gemini 3 以及其病毒式图像生成器的最新版本 Nano Banana Pro 之后,为夺回市场份额而制定的计划——这两个模型都在多个基准测试中登顶了 LMArena 排行榜。
即使 OpenAI 上周以 发布 GPT-5.2(被宣传为其迄今为止最先进的模型)来回应谷歌的成功,谷歌仍然保持领先地位,该模型主要面向开发人员和日常专业用户。OpenAI 原本计划在 1 月初发布新的图像生成器,但本周的公告加速了这些计划。其上一个图像模型发布是 4 月份的 GPT Image 1。
GPT Image 1.5 的发布正值图像和视频生成器超越原型,获得更多面向生产环境的能力之际。与 Nano Banana Pro 类似,ChatGPT Image 也提供了后期制作功能,允许对人脸相似度、光照、构图和色彩基调等进行更细粒度的编辑控制,以在多次编辑中保持视觉一致性。
大多数生成式 AI 图像工具在迭代方面表现不佳,因此这将是一个巨大的进步。当要求进行特定更改时,例如“调整面部表情”或“让光线更冷”,模型通常会重新诠释整个图像,导致一致性缺失。
此次更新不仅仅是关于新功能。OpenAI 应用程序首席执行官 Fidji Simo 在周二的一篇博客文章中写道,ChatGPT 图像现在还可以通过 ChatGPT 侧边栏中的一个专用入口点访问,该入口点“更像一个创意工作室”。
Simo 写道:“新的图像查看和编辑界面使创建符合您愿景的图像或从热门提示和预设滤镜中获取灵感变得更加容易。”
— OpenAI (@OpenAI) December 16, 2025
除了新的图像生成器之外,OpenAI 还正在引入新的方式来通过更多视觉元素改进 ChatGPT 体验。据 Simo 介绍,计划是让搜索查询显示更多带有清晰来源的视觉内容,这对测量转换或查询体育比分等任务会很有帮助。
Simo 写道:“在创作时,你应该能够看到并塑造你正在创造的东西。当视觉效果比单纯的文字更能讲述故事时,ChatGPT 应该包含它们。当你需要快速答案或下一步操作在另一个工具中时,它应该就在那里。当我们这样做时,我们可以继续缩小你脑海中的想法与将它变为现实的能力之间的差距。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区