目 录CONTENT

文章目录

Adobe 的“纠错式 AI”可以改变画外音的情绪

Administrator
2025-10-30 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/adobe-max-sneaks-2025-corrective-ai/

原文作者:Jacob Roach


Adobe 让我坐下来看了一段带有平铺直叙、略显无聊的画外音演示视频。这本身没什么特别的,但在调出文本、高亮显示文本并从一系列预设情绪中进行选择后,声音的表现力完全改变了。它在几秒钟内就从平淡变成了自信,然后从自信变成耳语。

Adobe 称之为 Corrective AI(纠错式 AI),这是该公司今天晚些时候在其 MAX Sneaks 演示中展示的众多功能之一,该演示在洛杉矶举行的更广泛的年度 MAX 创意大会期间进行。(Adobe 支付了部分我参加其 MAX 大会的差旅费用。)Sneaks 是 Adobe 展示其正在开发中的未来技术和原型的场合,其中许多功能最终会在几个月内进入 Adobe 的完整创意套件。

今年的 MAX 大会上,Adobe 为 Firefly 发布了生成式语音功能,该功能不仅允许用户使用几种预设声音,还可以添加情绪标签来改变语调。这个 Corrective AI 功能将这种功能带入了一个更实用的工作流程。它不是使用完全由 AI 生成的声音,而是可以对现有的人声表演进行润饰。

Exclusive Adobes Corrective AI Can Change the Emotions of a VoiceOver
摄影:Jacob Roach

Adobe 的 Lee Brimelow 还向我展示了 AI 如何从单个音轨中提取不同部分以创建多个音轨。这项名为 Project Clean Take 的 Sneaks 原型仅限于五个音轨,但它可以分离人声、环境噪音、音效等等。AI 模型能够如此准确地分离音轨,令人惊讶。在一个例子中,Adobe 向我展示了某人在一座吊桥前讲话,吊桥的铃声完全盖过了主持人的声音。运行 AI 模型后,铃声消失了。更好的是,Adobe 给我看了如何通过单独调整这些分离音轨的电平来恢复铃声。

在另一个例子中,Adobe 演示了这对创作者在公共场合拍摄时有多大用处,尤其是在背景中有授权音乐播放时。众所周知,未经授权的音乐是导致 YouTube 等平台上出现版权警告的捷径。在演示中,Adobe 的 AI 模型能够分离音乐,用 Adobe Stock 中的类似音轨替换它,并应用效果使之具有原始音轨的混响和氛围,所有这些只需点击几下。

这些功能利用 AI 来解决视频编辑人员和创作者日常面临的问题,帮助恢复损坏的音频或节省重新录制人声的精力和麻烦。Adobe 还将在其 Sneaks 演示中展示新的生成式 AI 功能。对于声音设计师而言,该公司向我展示了其 AI 模型如何自动分析视频并为其添加音效,所有这些音效据称都是 AI 生成的,但在商业上使用是安全的

Exclusive Adobes Corrective AI Can Change the Emotions of a VoiceOver
摄影:Jacob Roach

Adobe 的 Oriol Nieto 加载了一段带有几个场景和画外音但没有音效的短视频。AI 模型分析了视频并将其分解为场景,应用了情绪标签和每个场景的描述。然后,音效出现了。例如,AI 模型识别出一个有闹钟的场景,并自动生成了一个音效。它识别出一个主角(在本例中是一只章鱼)正在开车,并添加了关门声效。

它并不完美。闹钟声听起来不真实,在一个两个角色拥抱的场景中,AI 模型添加了不自然、不恰当的衣物摩擦声。Adobe 没有手动编辑,而是使用了一种对话式界面(类似于 ChatGPT)来描述更改。在汽车场景中,没有汽车的环境音。Adobe 没有手动选择该场景,而是使用对话式界面,要求 AI 模型向该场景添加汽车音效。它成功找到了场景,生成了音效,并将其完美地放置到位。

这些实验性功能尚未发布,但它们通常会进入 Adobe 的套件。例如,Photoshop 中可以自动以准确的颜色和光照将素材放置到场景中的 Harmonize 功能,去年在 Sneaks 上展示过。现在,它已集成到 Photoshop 中。预计这些新功能将在 2026 年的某个时候出现。

Adobe 的这一公告是在电子游戏配音演员结束了近一年的罢工以争取围绕 AI 的保护措施仅仅几个月之后——罢工要求游戏开发人员希望通过 AI 复制配音演员的声音或形象时,公司必须获得同意并提供披露协议。配音演员们已经为 AI 将对行业产生的影响做好了很长一段时间的准备,而 Adobe 的新功能,即使它们不是从头开始生成画外音,也是 AI 正在强迫创意行业发生转变的又一个标志




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区