目 录CONTENT

文章目录

快手可灵数字人 2.0 全量上线:三步实现“能说会演”,最长支持 5 分钟视频生成

Administrator
2025-12-05 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.ithome.com/0/902/572.htm

原文作者:清源


IT之家 12 月 4 日消息,据可灵官方公众号,全新一代可灵数字人 2.0 即日起全量上线,经过上传角色图 → 添加配音内容 → 描述角色表现三个步骤,即可生成“能说会演”的数字人。

根据介绍,本次更新针对旧版带来了三大突破性改变表现力拉满、手部及口型精准控制、支持最长 5 分钟内容。其“精通”体态动作、手势、表情、镜头语言,可做到更生动的情绪传达。


据IT之家了解,可灵 AI 于今年 9 月推出数字人功能。当时,通过一张角色图片加一段文字或音频,即可生成 1080p / 48FPS、最长 1 分钟的数字人视频。该数字人功能基于多模态理解与视频生成模型的深度结合,实现了口型精准同步以及情绪动作的精细控制。其采用的基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,从而确保生成的数字人在视频全程保持角色一致性。


广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区