目 录CONTENT

文章目录

OpenAI强化开发者生态:API发布更强大的模型,包括GPT-5 Pro和Sora 2

青云TOP
2025-10-07 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2025/10/06/openai-ramps-up-developer-push-with-more-powerful-models-in-its-api/

原文作者:Rebecca Bellan


在周一的Dev Day上,OpenAI宣布了最新的API更新,重磅推出了其最新一代语言模型 GPT-5 Pro,全新的视频生成模型 Sora 2,以及一个更小、更经济的语音模型。

全面赋能开发者生态

这些重磅更新是OpenAI旨在吸引开发者加入其生态系统的一系列重大举措的一部分,其中包括推出智能体构建工具(agent-building tool)以及在ChatGPT中构建应用程序(apps in ChatGPT)的功能。

OpenAI Dev Day 发布会截图
图片来源:OpenAI

OpenAI首席执行官Sam Altman表示,GPT-5 Pro的推出将特别吸引那些构建金融、法律和医疗保健等需要“高精度和深度推理”的应用的开发者。

实时语音交互:更便宜、低延迟

Altman还强调,语音能力在未来将至关重要,因为它正迅速成为人们与AI交互的主要方式之一。为此,OpenAI正在API中推出 “gpt-realtime mini”,这是一个更小、更便宜的语音模型,支持音频和语音的低延迟流式传输交互。据悉,新模型的成本比OpenAI之前的高级语音模型便宜了70%,但承诺提供“相同的音质和表现力”。

Sora 2 登陆 API,赋能创意开发

OpenAI的开发者生态系统的创作者现在可以在API中预览Sora 2。Sora 2是其最新的音视频生成模型,于上周与Sora应用一同发布(Sora应用是一个带有AI生成视频的TikTok竞争者)。Sora应用允许用户根据提示生成自己、朋友或任何事物的视频,并通过类似TikTok的算法信息流进行分享。

Altman表示:“现在,[开发者]可以在自己的应用程序中访问驱动Sora 2惊人视频输出的同一个模型了。”

Sora 2在上一代的基础上进行了升级,能够生成更逼真、物理上更一致的场景,并具有同步的声音效果。它提供了更大的创作控制力,包括详细的摄像机指导和风格化的视觉效果。

“例如,你可以拍摄一个iPhone视角,然后提示Sora将其扩展成一个宏大、电影感的广角镜头,”Altman说。“但我们一直在努力的最令人兴奋的一点是,这个新模型如何将声音与视觉效果完美结合,不仅仅是语音,还包括丰富的音景、环境音频、与你所见内容同步的效果。”

Sora 2被定位为概念开发的工具,无论是为广告提供基于产品整体氛围的视觉起点,还是帮助美泰(Mattel)设计师将草图转化为玩具概念——Altman在Dev Day上展示的这个例子,也暗示了OpenAI与这家芭比玩具制造商合作,将生成式AI引入玩具制造流程的交易。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型:https://api.qingyuntop.top/pricing

详细的调用教程及文档:https://api.qingyuntop.top/about

0

评论区