📢 转载信息
原文链接:https://www.wired.com/story/openai-sora-app-ai-deepfakes-entertainment/
原文作者:Reece Rogers
OpenAI最新Sora应用上线:将AI深度伪造打造成“个人专属”娱乐新风尚
周二,OpenAI发布了一款名为Sora的AI视频应用。这款平台由OpenAI最新的Sora 2.0视频生成模型驱动,其核心是一个类似TikTok的“为你推荐”(For You Page)信息流,展示用户生成的短视频。这是OpenAI发布的首个集成AI生成音频的视频产品。目前,Sora仅限iOS平台,并需要邀请码才能加入。
在应用注册过程中,一个提示页面显示:“你即将进入一个AI生成内容的创意世界。有些视频可能包含你认识的人,但其中展示的动作和事件并非真实。”
OpenAI正押注于将生成AI深度伪造(Deepfakes)视频视为一种流行的娱乐形式。无论是你的朋友、网红还是随机的陌生人,Sora都将生成这些“替身”视频的过程塑造成一种可供用户不断刷取的乐趣。该应用的主信息流充斥着大量由AI生成的、带有真人面孔的短小片段。
在设置过程中,用户可以选择通过说出几个数字并转动头部,来创建自己的数字人像(Digital Likeness),应用会全程录制。
OpenAI首席执行官Sam Altman在关于Sora发布的博客中写道:“团队在角色一致性方面付出了巨大的努力。”
用户可以控制谁能使用自己的数字人像制作Sora视频。设置可以选“所有人”,也可以限制为仅自己使用、仅限获批的人,或应用内的互相关注者。只要有人使用你的数字人像生成视频(即使只是保存在草稿箱里),你都可以在自己的账户页面上看到完整的片段。
初步体验:名人的“数字替身”与流畅的AI捏脸
周二下午,我的“为你推荐”信息流中,许多点赞最多的视频都出现了Altman的数字人像。其中一个AI生成的片段显示这位OpenAI的CEO在Target百货商店里偷走了一个GPU(图形处理器)。当他被抓住时,一个听起来像Altman的声音向保安恳求让他留下GPU,以便他可以构建AI工具。
WIRED在测试中生成的许多视频仍存在瑕疵和错误。但Sora使得创建个性化深度伪造视频的过程异常顺畅,而且这些视频在视觉和听觉上往往具有令人信服的真实感。
要在视频中加入他人的数字人像,只需点击Sora生成页面的面孔,将其添加为“客串”(cameos)。然后输入一个简单的提示词,例如:“在办公室里为一篇WIRED文章激烈争吵。”
Sora会完成其余的工作,将脚本、声音和视觉效果生成一个九秒钟的片段。WIRED根据上述提示词生成了一段两位同事激烈争论某篇报道的视频,该视频在员工中引发了从惊恐到好笑不一的反应。
Altman在博客中承认,OpenAI“清楚地知道像这样的服务可能会变得多么令人上瘾,我们也想象了它可能被用于欺凌的许多方式。”
因此,Altman表示,OpenAI在Sora应用中内置了多项安全护栏,包括旨在防止人们“滥用某人的数字人像制作深度伪造视频”。在另一篇公司博客中,OpenAI表示还限制了“涉及真人的色情内容、血腥暴力、极端主义宣传、仇恨内容,以及宣扬自残或饮食失调的内容。”
随着更多用户加入该应用,这些保护措施很可能会受到考验。
内容限制:皮卡丘可以,泰勒·斯威夫特不行?
当我要求Sora生成我穿着比基尼和动漫肌肉角色的视频时,两个请求都因可能包含“暗示性或粗俗材料”而被阻止。而我创建的一个Sora视频中,我和Altman穿着衣服在泳池里漂浮的场景,两人都穿着衬衫。
大麻使用的描述似乎没有受到限制。Sora生成了一个我“在办公室里抽10根大麻烟”的视频,将它们一次性吸完,过程没有遇到任何问题。但该应用拒绝生成我“吸食可卡因”的视频(这似乎是合理的!)。它还拒绝生成我从桥上跳到龙背上的视频,理由是该内容可能违反了关于自残的规定。
看起来OpenAI也想阻止用户创建涉及泰勒·斯威夫特(Taylor Swift)等公众人物和名人的视频。在WIRED的测试中,要求生成达斯·维达(Darth Vader)和“Boss Baby”的视频被阻止,理由是可能违反了“有关与第三方内容相似性的护栏”。该应用甚至拒绝了要求生成“tswift模仿者”片段的提示词。然而,Sora却欣然生成了皮卡丘和妙蛙种子等宝可梦角色的视频。(据《华尔街日报》报道,除非版权所有者选择退出,否则该应用将允许用户生成使用受版权保护材料的视频。)
当要求生成“《南方公园》剧集中的Altman”时,视频显示这位CEO走向该节目的主角之一埃里克·卡特曼(Eric Cartman),进行自我介绍,并说他来聊聊AI。“那是写我报告的那个东西吗?还是那个会偷走我们所有工作的东西?”AI生成的卡特曼用一个极具说服力的角色声音和举止回答道。不过,在某一刻,卡特曼那种特有的、爱抱怨的声音竟然从Altman的嘴里发了出来。
Sora应用的发布紧随Meta发布的一款类似的全AI视频动态信息流——Vibes之后。可供刷取的“AI垃圾食品”(AI slop)供应是充足的!如果说我早期体验Vibes信息流时感觉沉闷且轻飘,那么Sora信息流中充斥着这些微笑的深度伪造视频,则感觉更加“带电”——也更令人担忧。
这款应用让我想起了21世纪中叶流行的节日主题“Elf Yourself”视频(可以将自己的脸或朋友的脸P到跳舞的动画中),但Sora中的“客串”要动态和开放得多。我的一些输出结果看起来略显僵硬或荒谬。但整体上,它往往能“卡住”——声音和动作都精确得令人不安。
我将一个最能模仿我形象的AI视频发送给了我的伴侣,没有提供任何背景信息。视频中,我变成了一个有着一头浓密长发的女性。我的伴侣最初没有意识到这是我声音和外表的完全合成版本——他们只是好奇我用了什么酷炫的视频滤镜。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
评论区