OpenAI的Sora模型：AI视频生成领域的新篇章-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.bbc.com/news/articles/c93w90kqgv9o?at_medium=RSS&at_campaign=rss

原文作者：BBC News

OpenAI发布了一款名为Sora的文本到视频生成模型，这被认为是人工智能在视频生成领域的一个重大飞跃。

OpenAI的Sora能够根据文字提示生成长达一分钟的高质量视频，在复杂场景的理解和模拟方面取得了显著进步。

Sora的惊人能力

OpenAI在周四发布了一系列展示Sora潜力的视频样本。这些视频涵盖了从逼真的城市景观到超现实的奇幻场景，其视觉质量和连贯性令人印象深刻。

在许多样本中，Sora展示了对物体运动和物理世界交互的深刻理解。例如，一个视频展示了一群狼在雪中奔跑，准确地模拟了雪花飞扬和光影的变化。

OpenAI表示，Sora是一个扩散模型（diffusion model），这意味着它通过学习如何从随机噪点中逐步“去噪”来创造图像，但这次是生成连贯的视频序列。

Sora的核心优势在于其对世界模型的理解。它不仅能生成视觉上逼真的画面，还能在多角度镜头转换中保持场景和角色的持久性。

在一段展示中，一个女子在东京街头行走，镜头围绕她旋转，她的衣服和发型保持一致。另一段展示了两只金毛猎犬在沙滩上奔跑，动作流畅自然，甚至精确地模拟了水花溅起的效果。

一位OpenAI研究人员评论道：“Sora不仅仅是生成图像，它是在模拟现实世界。”

OpenAI的首席执行官萨姆·奥特曼（Sam Altman）在X（前身为Twitter）上分享了这些视频，引发了科技界的广泛关注。

Sora的生成长度可以达到惊人的一分钟，这在当前AI视频生成领域是一个显著的里程碑。许多现有的模型通常只能生成几秒钟的片段。

OpenAI在一篇博文中解释说，Sora的训练基于大量的视频数据，使其学会了世界的物理规律，包括光线、运动和物质的相互作用。

我们相信，像Sora这样的工具可能使内容创作民主化，并为电影制作、视觉艺术甚至科学模拟开辟新的可能性。

然而，这项技术也带来了显著的伦理和安全担忧。

Sora的逼真度和易用性引发了对深度伪造（deepfakes）和虚假信息传播的担忧。如果任何人都能轻易生成逼真的视频，区分真实与虚假将变得更加困难。

OpenAI承认这些风险，并表示他们正在采取预防措施。目前，Sora尚未向公众开放，仅供少数“红队”（red teamers）测试，以评估其潜在滥用风险。

“我们正在对Sora进行安全评估，包括构建工具来检测和标记虚假内容，”OpenAI在一份声明中说。

Sora对创意产业的影响是巨大的。电影制作人、广告商和数字艺术家可能会使用Sora作为工具，快速将概念视觉化，大大缩短制作周期。

然而，也有人担心，这项技术可能最终取代部分初级创意工作。

加州大学伯克利分校的计算机科学教授特雷弗·拉格罗姆（Trevor Pagliarini）评论说：“这看起来非常先进，它正在将我们带入一个我们必须认真对待AI生成媒体的新时代。”

尽管存在挑战，Sora的发布无疑为文本到视频生成设定了新的行业标准，预示着人工智能在视觉叙事方面的未来充满无限可能。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。