📢 转载信息
原文链接:https://www.wired.com/story/the-future-of-ai-media-parody-of-the-apocalypse-guy-named-josh/
原文作者:Christopher Beam
AI创作的挣扎与突破:当导演遇上不听话的AI外星人
这位电影制作人无法让外星人“蒂吉”(Tiggy)听话。他只是需要这个闪闪发光的棕色生物转过头去。但蒂吉正坐在警车的副驾驶座上,却一直在违抗指令。起初,蒂吉只是稍微转动了一下眼睛。然后他看向了摄像机的错误一侧。接着,他的皮肤变得斑驳,像熟过头的果实。
这位电影制作人并不在片场,也不在火星上。他正坐在洛杉矶的家中电脑前,使用一款名为FLUX Kontext的人工智能软件,不断生成和重新生成外星人的图像,只为得到一个可用的画面。他使用Midjourney等AI工具生成了蒂吉的第一个图像(提示词:“一个长着小嘴巴、小嘴唇的胖外星人”);使用ElevenLabs为蒂吉的声音创造音色(电影制作人自己的声音经过合成和大幅度升调);还使用了Runway来描述他想要的精确镜头(“特写镜头,小外星人坐在副驾驶座上,浅景深”)。

AI总是在出错。在一个镜头里,蒂吉看起来莫名其妙地强壮。在另一个镜头里,他的背部太干燥了。当导演要求AI给蒂吉的后脑勺加上“青蛙般的皮肤”时,它竟然在他头上叠加了一张完整的青蛙脸。AI似乎抵制描绘裸体的蒂吉,但蒂吉确实不穿衣服。当导演要求一个“矮小的赤裸外星人”时,他得到了一个错误信息,这可能是因为工具的保护机制。“就因为我说了‘赤裸’这个词,”他猜测道。
围绕AI的叙事往往是“全有或全无”的:要么我们完蛋了,要么它只是炒作。看着这位电影制作人——手里拿着早晨的冰咖啡,棕色的头发和胡须略显凌乱——使用AI软件工作的情景,比那些宏大的叙事要古怪得多,也少了很多戏剧性。这就像是闯入小狗培训班。这些工具不断地忽略指令,做出奇怪的选择,或者完全偏离轨道。但通过细心和耐心,他最终驯服了它们,创作出了八分钟内容丰富、剧本完整的原创电视内容。
在这种情况下,这八分钟是他以“Neural Viz”之名创建的科幻电影宇宙中的最新一集。该项目始于2024年,推出了一个伪纪录片网络剧集《未解之谜》(Unanswered Oddities),一个来自未来地球的访谈节目,地球上生活着一群被称为“格伦人”(glurons)的生物,他们热衷于像《远古外星人》风格那样推测他们的人类前辈。每一集都探讨了“人”(hooman)文明的一个不同(且发音糟糕)的方面,比如美国、运动或NFL。起初,这似乎只是一个有趣的、独立的片段。
但随后,这个被称为“万物宇宙”(Monoverse)的世界开始扩张。Neural Viz推出了来自同一格伦人电视频道“Monovision”的不同系列剧集:一部纪录片警匪片,一个关于昆虫格斗的UFC式节目。接着出现了播客、街头采访。视频之间开始出现副线和故事情节,浪漫关系形成,宗教邪教潜伏在背景中,关于人类灭绝真实情况的模糊档案录像浮出水面。不久,这位电影制作人就建立了一个拥有自己的语言、角色和背景设定的完整世界,所有这些都由AI制作而成。
Neural Viz成为了一个邪典热门——受到Reddit用户和Twitter上AI爱好者的喜爱——然后成为了真正的热门,单集视频在YouTube上的观看次数达到数十万,在TikTok和Instagram上的观看次数达到数百万。
但超越任何受欢迎程度的衡量标准,Neural Viz代表着一项历史性的成就:它是首批真正不那么“烂”的AI影视作品之一。“AI视频”这个词往往会让人联想到最糟糕的画面:在跳水板上的河马、驾驶飞机的婴儿、吃意大利面的特朗普和奥巴马亲吻。换句话说,就是“垃圾内容”(slop)。这种媒介的声誉理应是负面的,原因既有美学上的,也有政治上的。有人认为,机器人将毁掉好莱坞、摧毁工作岗位,并将观众更深地推入算法导致的呆滞状态。
Neural Viz展示了另一条前进的道路。在一个充斥着最底层、最低努力的AI垃圾内容的时代,该频道的作者正在创作原创作品,以一种如同任何一部剧集一样具体、充满爱意的想象力来执行他的愿景。有几个重要的细节:尽管他正在编写提示词来帮助完成几乎所有其他制作角色,但Neural Viz的创作者却在用老式方法编写剧本。他自己扮演所有角色,将AI用作面具。设置好所有镜头后,这位电影制作人使用Runway的面部动作捕捉工具来赋予蒂吉生命,他亲自表演外星人的台词——就像安迪·瑟金斯(Andy Serkis)在旋转椅上扮演咕噜(Gollum)。
正如特雷·帕克和马特·斯通通过使用最廉价的工具重新发明了卡通片一样,Neural Viz背后的这位男士正在利用许多人认为不入流的技术,将其推向新的方向。他可能就是第一位AI作者。
在扮演这个角色时,他一直保持着几乎完全的匿名——直到现在。
乔希·华莱士·科里根(Josh Wallace Kerrigan)是三个兄弟中最小的一个,在德克萨斯州威奇托福斯(Wichita Falls)附近的一个小镇长大,他看着《震颤日记》(Tremors)和《侏罗纪公园》(Jurassic Park)等电影长大。9岁或10岁时,他和朋友用台式电脑上的摄像机制作了一部关于一个棒球杀手的短片。(标语:“三振出局。”)他在明尼苏达州州立大学莫尔海德分校学习电影,2012年毕业后,科里根搬到了洛杉矶。
在接下来的十年里,他遵循了2010年代在洛杉矶追求喜剧编剧的“标准指南”。他做过一系列白天的兼职工作,包括在“塔吉特内的一家星巴克”做咖啡师,担任过喜剧电影《邻居》(Neighbors)联合编剧的导演助理,以及为《姆法萨:万兽之王》和约翰·塞纳-奥卡菲娜主演的喜剧《大奖赛》(Jackpot!)等电影制作幕后和宣传视频。他组建了一个名为Hush Money的短剧团体,并每周制作一个视频,该视频出现在Funny or Die的YouTube频道上。(该团体专门从事类型讽刺,包括一个获得了导演温子仁赞扬的《电锯惊魂》的模仿作品。)2021年,他执导了一部低成本恐怖片,并将一个电视剧本卖给了迪士尼。
科里根积累了大量的经验——他达到了可以扮演片场所有角色的地步,从摄影师到灯光师再到录音师——但却难以获得持久的影响力。疫情及其后果摧毁了传统的好莱坞编剧道路。流媒体泡沫破裂,编剧房间规模缩小。编剧和演员工会的罢工使工作停滞了数月,他们最终签署的合同反映了越来越小的蛋糕,以及对AI侵蚀的担忧。
2023年,科里根开始摆弄Blender和Unreal Engine等3D建模软件。他对动画很感兴趣——他喜欢可以随时返回的构建角色和场景的想法——并想看看自己能做些什么。他很快了解了Midjourney和Hedra等少数新兴的生成式AI应用,发现它们自动化并加速了3D建模中最困难的部分。
当大多数人第一次接触生成式AI工具时,他们倾向于从他们能想象到的最古怪的事情开始。这些“疯狂”的想法通常出奇地笼统:太空中的龙、哭泣的小猫、机器人起义。科里根采取了相反的方法:他密切关注AI的局限性并设法绕过它们。他注意到这些工具在动作场景中表现不佳,但在访谈镜头中表现出色,所以他决定制作一些纪录片风格的内容。他想避免模拟人类的“恐怖谷”效应,所以他选择了球状的外星生物。为了掩盖渲染的瑕疵,他倾向于采用80年代和90年代电视那种老式的颗粒感外观。因此诞生了《未解之谜》,它对NBC的《未解之谜》(Unsolved Mysteries)的死板模仿是显而易见的。
科里根早期的剧集看起来有些粗糙,但它们很快确立了该剧的冷幽默风格和宏大的愿景。它们也为“万物宇宙”设置了一些核心元素和冲突:统治星球的专制神祇“巨石”(Monolith),试图推翻它的“抵抗军”(Resistance),以及认为“人类”(hoomans)不存在的喋喋不休的阴谋论者蒂吉·斯基布尔斯(Tiggy Skibbles)——然后他神秘地消失了。

对科里根来说,发现生成式AI应用感觉像是解锁了新的力量。“第一次开始看到那些奇怪的生物说话什么的,真是太令人震惊了,”他说。他感觉自己就像派对角落里那个看着大家跳舞,心里想着“他们不知道”的那个人的迷因。
在Reddit上,用户对Neural Viz选择迎合AI的怪癖甚至缺陷表示赞赏。科里根也从其他创作者那里获得了赞誉,他们推测该频道背后的艺术家身份。“我以为他是迈克·贾奇(Mike Judge)在用假名隐藏,”AI视频创作者扎克·伦敦(Zack London,别名Gossip Goblin)说,他在Instagram上有超过一百万粉丝。
在初步的反响鼓励下,科里根决定制作更多剧集,但他不知道自己会走向何方。“没有计划,”他说,所以他决定保守自己的身份秘密。科里根不断试验新的形式,这得益于他对类型讽刺的把握和保持自己兴趣的渴望。他创作了《警察档案》(The Cop Files),这是《X档案》与《警察实录》的衍生剧,其中一名侦探调查蒂吉的失踪案;后来是《人类猎手》(Human Hunters),对《捉鬼敢死队》的模仿。
该系列也随着技术不断发展。随着新的生成式AI应用的频繁发布,科里根一直热衷于尝试尽可能多的应用。(尽早使用新的软件可以吸引对技术好奇的观众。)当他刚开始时,他会录制对话片段——也就是说,对着麦克风朗读台词——然后AI会尽力使角色的嘴型与所说的词语大致匹配,并添加一些基本的面部动作。这让科里根在表演上有了一定的控制力,但并不多。然后,在2024年10月,Runway发布了其动作捕捉工具Act-One。现在,他可以在电脑前表演台词,软件会将他的演绎(包括声音和面部动作)映射到角色的模型上。这让他对角色的外观和行为有了更多的控制。这也使得内容比以往任何时候都更具“他”的特色。(另一方面,在我看来,角色开始显得更加“统一”地像他了。科里根说他想雇佣其他演员来使表演多样化,但目前自己扮演所有角色更容易。)
有时,新的工具会开启新的叙事可能性。当谷歌的Veo 2视频生成器可用时,科里根制作了一个展示“闪回”的视频,回到了巨石消灭人类的那一刻——这是该系列的首个叙事序列。《警察档案》也更具叙事性了;角色不再是直接对着镜头说话,而是四处移动、彼此互动、踏上任务。
技术变化甚至影响了节目的背景故事。在4月份发布的一集中,蒂吉的皮肤比平时明显光滑,因为科里根当时使用的视频生成工具Sora在角色一致性方面遇到了困难。为了掩盖这一缺陷,科里根让蒂吉解释说他正在“变形”,因为他再也负担不起他的“变形抑制剂”了。这正好符合剧中一些角色提出的理论,即格伦人是人类的变异版本。从那集之后,“变形抑制剂”就成为了一个反复出现的笑点。
机器的错误经常会成为这样的创作素材。一位痴迷于刀具的格伦牧场主Reester Pruckett——许多Neural Viz的角色是科里根从小接触的美国南方人的外星版本——有一个奇怪的习惯,就是用一个极长的元音开头说话,例如:“我iiiiiiiiiiiiiiiiiiiiii来这里是为了练习我的弹簧刀。”这最初是软件中的一个故障,但它非常有趣,所以科里根决定将其保留为普克特的标志。
2024年底,好莱坞高管开始在社交媒体上私信科里根。他告诉我,他与“几乎所有主要制片公司”以及希望合作的制片人和创作者进行了交谈。许多YouTube评论者告诉科里根,他的视频应该在Adult Swim上播放。但当他与Adult Swim的制作人会面时,他说,其中一人建议他可能不需要他们;权力已经转移到了创作者手中。“在与其他各个制片公司的会议中,这个观点被多次提及,”科里根说。
这些会面带来了两个工作机会。一个是在制片公司内部从事与AI项目相关的工作。科里根拒绝了这份工作,转而与一位独立制片人合作制作自己的电视剧本(与万物宇宙无关)。他还计划在2025年春天于SXSW首映一部他联合执导的非AI短片。凭借新的电视剧本合同以及Neural Viz在YouTube和TikTok上产生的收入,科里根现在有了足够的钱维持生计。因此,在1月份,自搬到洛杉矶以来第一次,他辞去了白天的兼职工作。
六月,我参加了在纽约市举办的AI电影节,该活动由AI软件公司Runway组织。数百名观众挤满了林肯中心的爱丽丝·塔利厅(Alice Tully Hall),观看了被宣传为2025年10部最佳AI短片的影片,这些影片是从6000份投稿中选出的。
我发现整个活动令人沮丧。这些影片在视觉上令人惊叹,但在概念和叙事上却很薄弱。该活动,包括音乐艺术家Flying Lotus冗长乏味的问答环节,以及J Balvin一首部分由AI生成的音乐视频,似乎是为那些认为AI艺术只有表面没有灵魂的怀疑论者提供论据而精心设计的。(唯一的例外——一部巧妙而令人不安的电影评论《像素空间总览》(“Total Pixel Space”)——获得了最高奖项。)
AI电影界的一个悖论是,尽管这些工具的速度和复杂性很高,但能制作出令人难忘作品的创作者数量却很少。我之前提到了扎克·伦敦,即Gossip Goblin,他创作了关于电脑接管未来的、不祥的、印象派的视频。音乐家Aze Alter制作了怪异的恐怖相关短片。一个名为TalkBoys Studio的喜剧编剧二人组(他们是科里根的朋友)制作了以会说话的动物和恐龙为主角的动画短片。
更常见的是“提示即播放”(prompt-and-play)的AI视频,旨在病毒式传播。当谷歌的Veo 3在5月份首次亮相,使多模态视频生成变得像在框中输入提示词一样简单时,社交媒体上充斥着——算法知道原因——大脚怪对着前置摄像头说话的视频日志。一位网红甚至吹嘘设置了一个自动化的LLM到视频管道,每小时生成一个大脚怪片段并推送到TikTok。OpenAI在9月底发布Sora 2,允许用户扫描自己的面部并将其植入视频中,这只会加速“垃圾内容末日”(slopocalypse)。
Neural Viz之所以能突破噪音,部分原因在于科里根在工艺的许多方面都采取了非常传统的方法。他总是从写作开始——场景标题、动作描述、对话、摄像机移动。然后他对该剧集的每一帧进行故事板绘制;对于每个面板,他使用Flux、Runway或ChatGPT等图像生成器来创建静态图像。他确保灯光一致。在对话场景中,他保持视线连贯。他会注意使背景清晰可见(AI工具倾向于模糊物体),并设定场景的情绪。为了获得手持摄像机的效果,他会用iPhone拍摄他的显示器,然后将这种自然的运动映射到AI素材上:一种弥合真实与虚拟电影制作的技术。“我在这些工具中所做的一切都是在十多年中积累起来的技能,”他说。“我不认为有很多人能做到这一点。”

一天在Zoom上,我看着科里根制作他迄今为止最具挑战性的场景之一:蒂吉被劫持后又被救出,与抵抗军的领导会面,但事情并未按计划进行。这个场景需要微妙的身体动作、精确的时机、悬念,以及一个必须恰到好处的重大情节转折。每个元素都带来了独特的挑战。科里根不断调整一个角色的头部比例。当角色指向枪口时,他会努力使瞄准线对齐。他考虑如何让抵抗军领导人以一种看起来自然的方式摘下兜帽。
在科里根准备扮演蒂吉时,我收到了来自Runway发言人的电子邮件。他告诉我,他们新的动作捕捉软件Act-Two将于本周晚些时候发布。我将这个信息转告了科里根,他决定立即停止该剧集的制作。最好是等待并看看新工具能做些什么。
在洛杉矶与我共度一天快结束时,科里根和我参观了电影艺术学院博物馆,距他住处仅十分钟车程。我们走过了那些专门介绍过去电影技术的展览:选影盘(zoetrope)、Cinerama摄像机、机械怪兽。在花了一整天时间观看AI生成的格伦人之后,我认为即使是展览中展示的更近期的技术——奉俊昊的故事情节和怪兽模型,《复仇者联盟》的视觉效果——看起来也已经过时了。
我们停下来观看了一部早期手工上色的彩色电影,片中一个舞者对着镜头挥舞着她流动的迷幻长袍。科里根指出,给赛璐珞片上色的冲动可能更多是出于实验,而不是为了创造历史或发表什么深刻的艺术声明。“他们并不是在想,‘这东西有一天会进博物馆’,”他说。
科里根抵制对电影制作未来的宏大宣告。(事实上,他本不想去博物馆。)他认为自己不属于任何运动,并指出AI与其他任何工具一样。除了他的AI项目,他还在制作一部传统的恐怖片,该片基于他联合执导的短片,该短片获得了SXSW的观众奖。“我在这里是为了讲故事,而这些工具是工作流程的一部分,”他说。“它们不是万能的,而且我认为在短期内也不会是。”
然而,好莱坞正在为一场地震做准备。制片厂正在将AI整合到他们的工作流程中。詹姆斯·卡梅隆(James Cameron)加入了某AI公司董事会,而达伦·阿罗诺夫斯基(Darren Aronofsky)最近成立了一家专注于AI的工作室,并与谷歌的DeepMind合作。在最近的合同谈判中,编剧和演员工会争取了与AI相关的就业保护。
科里根说他因为使用AI在网上受到了一些批评,他也承认这项技术可能会扰乱好莱坞的劳动力模式。但他认为,更早存在的问题是制片厂控制着叙事内容。迪斯尼收购并拥有了他2021年制作的试播集,而AI使他能够自己创作和拥有作品。“有一种版本的这些工具可以让人更加独立于这个系统,我认为这可能是一件好事,”他说。一个缺点是:他担心职业倦怠。尽管能够每隔几周就能制作出影棚级别的视频有很多好处,但他现在感到必须每隔几周就制作出影棚级别的视频的压力。
TalkBoys Studio的编剧伊恩·麦克利斯(Ian McLees)和丹·邦文特尔(Dan Bonventre)说,他们AI作品最初的反响好坏参半。“我们那些写情景喜剧、写电影的朋友们都说,‘这不值得你花时间,这会扼杀工作岗位,’”麦克利斯说。“我们说,那些工作已经没了,是制片厂干掉的。”他将这种转变比作电影行业以前的颠覆,包括从手绘到3D动画的过渡。“我们想在桌边,而不是在菜单上,”他说。
扎克·伦敦/Gossip Goblin说,他从那些“非常、非常、非常教条地反对并讨厌它”的插画家同行那里得到了反驳。他说他对那些盲目反对的人几乎没有耐心。“老兄,你画的是兽迷同人图,”他说。“你不需要对第一个挑战你对创造力的认知的全新事物感到恐慌。”
到目前为止,视觉AI战争中的失败者似乎是那些技艺精湛的工匠——那些非常擅长完成一项技术任务的人。胜利者将是那些有想法的人:作家、导演、讲故事的人。那些也能运用这些工具的想法之人?他们将是神。
虽然一些新的AI工具正在促进“提示即播放”的方法,但其他工具正在为人类的精细调整提供更多的控制杆。当科里根使用Runway的新软件Act-Two恢复制作他的《警察档案》剧集时,它比Act-One更能捕捉到他表演的细微差别。在一个镜头中,当蒂吉说出一句充满感情的台词时,他的嘴唇微微颤抖。
万物宇宙背景故事中一个持续的谜团是人类是如何灭绝的。一个角色说,人们普遍认为他们是被自动扶梯杀死的,一个接一个地被卷入移动的缝隙中,“被他们自己愚蠢的发明消灭了。”这似乎是对AI的影射。在一集中,一名新闻记者在商场的自动扶梯前谈论自动扶梯的威胁。在设计这个镜头时,科里根本可以把自动扶梯周围的空间留空。但他插入了一段楼梯,和一个若无其事地走上去的身影。
请告诉我们您对这篇文章的看法。请将致编辑的信件发送至 mail@wired.com。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。
青云聚合API官网https://api.qingyuntop.top
支持全球最新300+模型:https://api.qingyuntop.top/pricing
详细的调用教程及文档:https://api.qingyuntop.top/about
评论区