目 录CONTENT

文章目录

OpenAI的Sora模型:AI视频生成领域的新篇章

Administrator
2025-12-13 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/c93w90kqgv9o?at_medium=RSS&at_campaign=rss

原文作者:BBC News


OpenAI发布了一款名为Sora的文本到视频生成模型,这被认为是人工智能在视频生成领域的一个重大飞跃。

OpenAI的Sora能够根据文字提示生成长达一分钟的高质量视频,在复杂场景的理解和模拟方面取得了显著进步。

Sora的惊人能力

OpenAI在周四发布了一系列展示Sora潜力的视频样本。这些视频涵盖了从逼真的城市景观到超现实的奇幻场景,其视觉质量和连贯性令人印象深刻。

在许多样本中,Sora展示了对物体运动和物理世界交互的深刻理解。例如,一个视频展示了一群狼在雪中奔跑,准确地模拟了雪花飞扬和光影的变化。

OpenAI表示,Sora是一个扩散模型(diffusion model),这意味着它通过学习如何从随机噪点中逐步“去噪”来创造图像,但这次是生成连贯的视频序列。

Sora的核心优势在于其对世界模型的理解。它不仅能生成视觉上逼真的画面,还能在多角度镜头转换中保持场景和角色的持久性。

在一段展示中,一个女子在东京街头行走,镜头围绕她旋转,她的衣服和发型保持一致。另一段展示了两只金毛猎犬在沙滩上奔跑,动作流畅自然,甚至精确地模拟了水花溅起的效果。

一位OpenAI研究人员评论道:“Sora不仅仅是生成图像,它是在模拟现实世界。”

OpenAI的首席执行官萨姆·奥特曼(Sam Altman)在X(前身为Twitter)上分享了这些视频,引发了科技界的广泛关注。

技术突破与挑战

Sora的生成长度可以达到惊人的一分钟,这在当前AI视频生成领域是一个显著的里程碑。许多现有的模型通常只能生成几秒钟的片段。

OpenAI在一篇博文中解释说,Sora的训练基于大量的视频数据,使其学会了世界的物理规律,包括光线、运动和物质的相互作用。

我们相信,像Sora这样的工具可能使内容创作民主化,并为电影制作、视觉艺术甚至科学模拟开辟新的可能性。

然而,这项技术也带来了显著的伦理和安全担忧。

伦理考量

Sora的逼真度和易用性引发了对深度伪造(deepfakes)和虚假信息传播的担忧。如果任何人都能轻易生成逼真的视频,区分真实与虚假将变得更加困难。

OpenAI承认这些风险,并表示他们正在采取预防措施。目前,Sora尚未向公众开放,仅供少数“红队”(red teamers)测试,以评估其潜在滥用风险。

“我们正在对Sora进行安全评估,包括构建工具来检测和标记虚假内容,”OpenAI在一份声明中说。

潜在影响

Sora对创意产业的影响是巨大的。电影制作人、广告商和数字艺术家可能会使用Sora作为工具,快速将概念视觉化,大大缩短制作周期。

然而,也有人担心,这项技术可能最终取代部分初级创意工作。

加州大学伯克利分校的计算机科学教授特雷弗·拉格罗姆(Trevor Pagliarini)评论说:“这看起来非常先进,它正在将我们带入一个我们必须认真对待AI生成媒体的新时代。”

尽管存在挑战,Sora的发布无疑为文本到视频生成设定了新的行业标准,预示着人工智能在视觉叙事方面的未来充满无限可能。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区