📢 转载信息
原文链接:https://openai.com/index/sora-2
原文作者:The Sora team
2025年9月30日
Sora 2 正式发布
我们最新的视频生成模型在物理准确性、逼真度和可控性方面均超越前代系统。其还支持对话与音效同步。立即在全新 Sora 应用中开启创作之旅。
今日我们正式发布旗舰级视频音频生成模型 Sora 2。
2024 年 2 月推出的初代 Sora 模型,堪称视频领域的 GPT‑1 时刻——首次让视频生成技术初现成效,通过提升预训练计算规模,实现了物体恒常性等基础行为的生成。此后 Sora 团队持续专注于训练具备更先进世界模拟能力的模型。我们相信这类系统对训练深度理解物理世界的 AI 模型至关重要。实现这一目标的关键里程碑在于掌握大规模视频数据的预训练与后训练技术——相较于语言领域,该领域仍处于萌芽阶段。
Prompt: figure skater performs a triple axle with a cat on her head
借助 Sora 2,我们正直面视频领域可能迎来 GPT‑3.5 式突破的时刻。Sora 2 能完成前代视频生成器难以企及——甚至完全无法实现——的任务:演绎奥运级体操动作、在冲浪板上精准模拟浮力与刚性动态的后空翻,以及在猫咪死命抓握时完成三周半跳跃。
Prompt: a guy does a backflip
先前的视频模型过于乐观——它们会扭曲物体并变形现实以成功执行文本指令。例如,当篮球运动员投篮不中时,球可能会突然传送到篮筐。而在 Sora 2 中,若篮球运动员投篮未中,球会从篮板反弹。有趣的是,模型产生的“错误”往往源于 Sora 2 隐含建模的内部智能体失误;尽管仍不完美,但其遵循物理定律的能力已显著优于前代系统。这对实用世界模拟器至关重要——必须能建模失败场景,而不仅限于成功。
该模型在可控性方面也实现了重大突破,能够执行跨越多个镜头的多重复杂指令,同时精确维持世界状态。它在写实风格、电影风格和动漫风格的呈现上均表现卓越。
Prompt: Vikings Go To War — North Sea Launch (10.0s, Winter cool daylight / early medieval)...
作为通用音视频生成系统,它能以高度逼真度创作复杂的背景音景、人声及音效。
Prompt: Two mountain explorers in bright technical shells, ice crusted faces, eyes narrowed with urgency shout in the snow, one at a time
您还可以直接将现实世界元素注入 Sora 2。例如,通过观察队友的视频,模型能精准还原其外貌与声音,植入任何 Sora 生成的环境中。该能力具有高度通用性,适用于人类、动物或物体。
Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much
该模型远非完美且存在诸多错误,但它验证了通过视频数据进一步扩展神经网络规模,将使我们更接近模拟现实的目标。
Sora 2 的部署
在通往通用模拟与物理世界 AI 系统的道路上,我们认为人们能从我们构建的模型中获得诸多乐趣。
数月前 Sora 团队首次尝试“上传自我”功能时,所有人都乐在其中。这仿佛是沟通方式的自然进化——从文字消息到表情符号,从语音笔记到如今的影像互动。
今日我们推出全新社交 iOS 应用“Sora”,由 Sora 2 驱动。在应用中,您可以创作内容、混搭他人作品、通过可定制的 Sora 信息流发现新视频,还能通过“客串”(cameos)功能将自己或朋友融入场景。只需在应用中完成一次简短的视频音频录制以验证身份并捕捉形象特征,就能将真实的自己精准置入任何 Sora 场景中。
上周我们已向 OpenAI 全体员工开放了该应用的内部测试。同事们反馈该功能已促成公司内部新友谊。我们认为围绕“客串”功能打造的社交应用,是体验 Sora 2 魔力的最佳途径。
负责任地推出
我们高度重视对“末日滚动”、成瘾性、孤立感及现实生活优化信息流的担忧——以下是我们的应对措施:
我们为用户提供自主掌控信息流的工具与选项。依托 OpenAI 现有大型语言模型,我们开发出可通过自然语言指令的新型推荐算法。同时内置定期健康监测机制,主动提供信息流调整选项。
默认情况下,我们优先展示您关注或互动对象的内容,并重点推荐模型判断您最可能用于创作灵感的视频。我们不以延长信息流停留时间为优化目标,而是刻意设计应用以最大化创作,而非消费。更多细节请参阅我们的信息流理念
这款应用旨在与好友共同使用。测试者普遍反馈:客串功能赋予了这款应用与众不同的乐趣——您必须亲自尝试才能体会,这确实是与人交流的新颖独特方式。我们采用邀请制推出该功能,确保您能与好友共同体验。当各大平台纷纷远离社交关系图谱之际,我们相信客串功能将强化社群凝聚力。
青少年福祉保护是我们的核心关切。我们为青少年用户设置了每日信息流可见层级数量的默认限制,并对该群体使用“客串”功能实施更严格的权限管控。除自动化安全防护体系外,我们正扩充人工审核团队规模,确保及时处理可能出现的欺凌事件。我们通过 ChatGPT 推出 Sora 家长控制功能,家长可覆盖无限滚动限制、关闭算法个性化推荐,并管理私信设置。
使用“客串”功能时,您可全程掌控与 Sor a的形象呈现。您可自主决定谁能使用您的“客串”形象,并随时撤销访问权限或删除包含该形象的视频。包含您肖像的视频(包括他人创建的草稿)均可随时查看。
本应用已解决诸多安全议题——肖像使用授权、来源追溯、有害内容生成防范等。详情请参阅《Sora 2 安全文档》。
其他应用的诸多问题源于其盈利模式——这种模式会激励与用户福祉相悖的决策。我们当前唯一的计划是:当需求远超可用计算资源时,最终为用户提供付费生成额外视频的选项。随着应用发展,我们将在此公开沟通任何策略调整,同时始终将用户福祉作为首要目标。
我们正处于这段旅程的起点,但凭借 Sora 2 强大的内容创作与混搭功能,我们相信这标志着共创体验全新时代的开端。相较于现有平台,我们乐观地认为这将为娱乐与创意提供更健康的发展环境。祝您玩得愉快 :)
Sora 2 服务上线及后续计划
Sora iOS 应用(在新窗口中打开)现已开放下载。您可在应用内注册,获取帐户开通时的推送通知。我们今日起在美国和加拿大启动首批用户开放,计划快速扩展至更多国家。收到邀请后,您还可通过 sora.com(在新窗口中打开) 访问 Sora 2。初期 Sora 2 将免费开放,并提供充裕的初始配额供用户自由探索其功能,但仍受计算资源限制。ChatGPT Pro 用户还可在 sora.com 使用我们实验性的高品质 Sora 2 Pro(在新窗口中打开) 模型(Sora 应用也将很快支持)。我们计划通过 API 发布 Sora 2。Sora 1 Turbo 将继续可用,您所有创作内容仍将保存在 sora.com(在新窗口中打开) 的个人库中。
视频模型正以惊人速度实现卓越性能。通用世界模拟器与机器人智能体将从根本上重塑社会格局,加速人类进步进程。Sora 2 标志着我们向该目标迈出了重要一步。秉承 OpenAI 的使命,确保人类在模型开发过程中受益至关重要。我们相信 Sora 将为世界带来无限欢乐、创造力与联结。
——Sora 团队撰写
主要目标与视觉效果
初读:巨龙掠过锯齿状冰峰,翼尖涡流卷起冰屑;再读:冰川碎裂的冰层坠落至钴蓝峡湾,琥珀色阳光亲吻鳞片上的霜晶;神情尽显掠食者的沉静/浑然天成的力量。
格式与视觉风格
时长 5.0 秒;4K 分辨率;180° 快门;模拟大画幅数码传感器呈现锐利微对比度;极细腻颗粒感;雪光折射处抑制晕影;无门帘抖动。
镜头与滤镜
主镜头:50mm 球面镜头搭载鼻锥式陀螺稳定航拍平台(平行追踪带轻微内弧轨迹)。滤镜配置:黑色 Pro-Mist 1/8 减光镜;圆偏振镜调节光线以抑制雪地眩光,同时保留镜面闪光效果。
调色/色调
高光:纯净冰白色调,冷色渐变过渡;中调:钢蓝色冰川与淡青色空气;暗部:板岩/青绿色调,冰裂细节清晰可辨;龙脊边缘以暖琥珀色晕染增强层次;霜花/鳞片处的镜面反射精准聚焦。
光影氛围
傍晚低角度斜射光;下坡风卷起飞雪;薄冻雾营造空间感;尾迹间歇性冰尘爆裂;巨龙奋力时吐出微弱气息蒸汽。
场景构图
巍峨冰塔群与匕首刃般的山脊线;中空镜头与巨龙并行追踪,冰川斜线向峡湾延伸;前景冰脊掠过形成视差效果;无人类建筑物。
服装/道具/载具备注
无(生物类)。表面质感:哑光犄角状棱脊,半虹彩鳞片覆有前缘微霜。
音效
高空风切变,每翼下压皆雷鸣般震颤,冰塔晶冰咔嗒作响,远方冰川崩解轰鸣;巨龙疾吐气息伴低沉轰鸣:“嘶——”(不足 1 秒)。无配乐——纯粹的场景震撼音效。
优化镜头清单(1 个镜头/5.0 秒)
0.0–5.0——“平行山脊切割”(50mm 镜头,机头搭载航拍机,略带内弧微推镜头)
我们跟随巨龙穿行于冰塔走廊;翼尖涡流将飞雪卷成缎带;崩落的冰块在远下方激起粉状烟柱;镜头缓缓逼近——鳞片清晰可见,琥珀色眼圈闪烁——巨龙随即转向峡湾俯冲,尾部如剪刀般划过,在冰川上投下漫长阴影。
创作宗旨:以一次决绝的航拍传递神话般的磅礴气势与触手可及的真实感——速度、磅礴身躯与原始寒意。
镜头笔记(成像原理)
50mm 焦段平衡生物存在感与景观尺度,避免微缩化;平行轨道 + 内弧轨迹强化速度与形态;微推镜头配合最强下冲力实现力量感强调;偏振镜控制眩光同时保留冰晶闪烁;背光/边缘阳光雕琢剪影轮廓;擦身而过的冰脊提供视差速度线索。
后期处理
极细颗粒(约 15%);雪面镜面反射光晕极微;轻度胶片模拟确保蓝调真实与黑调浓郁;多频段动态保留翅膀拍击声而不掩盖冰川崩裂轰鸣;海报画面:巨龙俯冲掠过阳光倾泻的冰塔,飞雪如流,峡湾深蓝在远方炽烈燃烧。
Sora 2
Debbie Mesloh
Caroline Zhao
发布于 2025 年 9 月 30 日
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区