📢 转载信息
原文作者:Ivan Mehta
开发者和公司越来越多地在应用程序中部署 AI 代理和聊天机器人,但到目前为止,它们大多局限于文本。数字虚拟人生成公司 Lemon Slice 正在努力通过一种新的扩散模型为这些聊天增加视频层,该模型可以仅凭一张图像创建数字虚拟人。
这款名为 Lemon Slice-2 的模型可以创建一个数字虚拟人,它可以在知识库之上运行,以扮演 AI 代理所需的任何角色,例如处理客户查询、回答家庭作业问题,甚至充当心理健康支持代理。
联合创始人 Lina Colucci 表示:”在生成式 AI 的早期,我的联合创始人们开始试验不同的视频模型,我们很快意识到视频将是具有交互性的。像 ChatGPT 这样的工具引人入胜之处在于它们的交互性,我们希望视频也能拥有这种层次感。”
Lemon Slice 表示,这是一个拥有 200 亿参数的模型,可以在单个 GPU 上以每秒 20 帧的速度实时直播视频。该公司通过 API 和一个可嵌入的小部件向公司提供该模型,公司只需一行代码即可将其集成到其网站中。创建虚拟人后,您可以随时更改角色的背景、风格和外观。
除了类人虚拟人,该公司还专注于生成非人类角色以适应不同需求。这家初创公司正在使用 ElevenLabs 的技术来生成这些虚拟人的声音。
Lemon Slice 由 Lina Colucci、Sidney Primas 和 Andrew Weitz 于 2024 年创立。该公司押注于使用其自有的通用扩散模型(一种生成模型,它通过从带噪声的训练数据中反向学习来生成新数据)来制作虚拟人,以此区别于竞争对手。
Colucci 称:”到目前为止,我见过的现有虚拟人解决方案都会给产品带来负面价值。它们看起来很恐怖,而且很僵硬。它们在几秒钟内看起来不错,但一旦你开始与它们互动,就会感觉非常怪异,而且不能让你感到放松。阻碍虚拟人真正流行起来的原因是它们还不够好。”
加入 Disrupt 2026 等候名单
将自己添加到 Disrupt 2026 等候名单中,以便在早鸟票发布时第一时间抢购。往届的 Disrupt 活动曾邀请了 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 等嘉宾登台——总计超过 250 位行业领导者参与了 200 多场会议,旨在助您成长并提升优势。此外,您还将遇到在各个领域进行创新的数百家初创公司。
加入 Disrupt 2026 等候名单
将自己添加到 Disrupt 2026 等候名单中,以便在早鸟票发布时第一时间抢购。往届的 Disrupt 活动曾邀请了 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 等嘉宾登台——总计超过 250 位行业领导者参与了 200 多场会议,旨在助您成长并提升优势。此外,您还将遇到在各个领域进行创新的数百家初创公司。
为了资助这项工作,该公司周二宣布已从 Matrix Partners、Y Combinator、Dropbox 首席技术官 Arash Ferdowsi、Twitch 首席执行官 Emmett Shear 以及 The Chainsmokers 处筹集了 1050 万美元的种子轮融资。
该公司表示,他们已设置了防护栏以防止未经授权的面部或语音克隆,并使用大型语言模型进行内容审核。
Lemon Slice 未透露使用其技术公司的名称,但表示该模型正被应用于教育、语言学习、电子商务和企业培训等用例。
这家初创公司面临着来自 D-ID、HeyGen 和 Synthesia 等视频生成初创公司,以及 Genies、Soul Machine、Praktika 和 AvatarOS 等其他数字虚拟人制造商的激烈竞争。
Matrix 的一位合伙人 Ilya Sukhar 认为,在视频突出的领域,虚拟人将非常有用。例如,人们更喜欢通过 YouTube 学习而不是阅读大段文字。他指出,Lemon Slice 的技术实力和其自身的方法将使其在众多初创公司中脱颖而出。
他表示:”这是一个深度技术团队,他们有交付机器学习产品的往绩,而不仅仅是演示和研究。许多其他竞争者都是针对特定场景或垂直领域的定制化方案,而 Lemon Slice 正在采取一种通用的、如同‘苦涩教训’式的扩展方法(即数据和算力的扩展),这种方法在其他 AI 模态中已经奏效了。”
Y-Combinator 的 Jared Friedman 认为,使用扩散式模型使 Lemon Slice 能够生成任何类型的虚拟人,而不是像其他一些初创公司那样只专注于类人或游戏角色虚拟人。
他表示:”我相信 Lemon Slice 是唯一一家采取根本性机器学习方法、最终能够克服‘恐怖谷’效应并打破虚拟人图灵测试的公司。他们训练与 Veo3 或 Sora 相同类型的模型:视频扩散 Transformer。因为它是一个端到端的通用模型,所以它的性能提升没有上限;而其他模型在达到逼真效果之前就已触顶。它既适用于人类面孔也适用于非人类面孔,而且只需要一张图像就能添加新面孔。”
这家初创公司目前有八名员工,计划利用这笔资金雇佣工程和市场进入(go-to-market)人员,并支付训练模型的计算费用。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区