📢 转载信息
原文作者:Anna Heim
人工智能让任何人都能创作视频,但许多AI视频创作工具却缺乏对音频的支持。Mirelo正在构建能够为视频动作添加匹配音轨的AI技术。
今年早些时候,这家总部位于柏林的初创公司发布了Mirelo SFX v1.5,这是一个能解析视频并添加同步音效(SFX)的AI模型。
这引起了那些为迎接游戏领域的生成式AI革命做准备的风险投资家的关注。这家成立两年的德国初创公司已完成4100万美元的种子轮融资,由Index Ventures和Andreessen Horowitz(a16z)领投,TechCrunch独家获悉。
这笔新资本将帮助Mirelo在其新兴领域中更有效地竞争。在其仍处于隐秘(stealth)模式且资源受限时,索尼和腾讯等大公司已经发布了视频转音效模型。来自中国的快手旗下的Kling AI以及同样获得a16z支持的ElevenLabs也发布了类似模型。
尽管Mirelo因其更专注的领域而与它们有所区别,但要从长远来看击败这些模型,这家初创公司需要进行额外的人员招聘。Mirelo的首席执行官兼联合创始人CJ Simon-Gabriel告诉TechCrunch,该公司预计到明年底,其10人团队的规模将“翻一番甚至翻三番”。
这些新员工将支持Mirelo的研发、产品和市场进入(go-to-market)战略。这家初创公司已将其模型发布在Fal.ai和Replicate上,Simon-Gabriel表示,短期内API使用将驱动其大部分收入。但该公司也在投资构建其面向创作者的工作空间Mirelo Studio,该工作空间最终可能支持专业的全面使用。
随着Mirelo准备扩展规模,这家初创公司及其投资者也在关注困扰其他生成式AI公司的关于训练数据的担忧。据Index领投投资的Georgia Stevenson介绍,Mirelo的模型基于公开和购买的声音库构建,并且正在签署尊重艺术家权益的收入分成合作伙伴关系。
这是生成式AI工具中固有的矛盾,但Mirelo目前还没有取代音乐家和音效设计师——至少目前还没有。通过包含每月20欧元(约合23.50美元)的推荐创作者计划的免费增值模式,这家初创公司主要瞄准的是希望为AI生成的视频“解除静音”的业余爱好者和专业用户。
据Simon-Gabriel称,如果没有音频,创作者无法充分利用这种新的潜力。
“乔治·卢卡斯说过,声音是观影体验的50%。这并非夸张之词,”他说道。“如果说有什么不同,那也只是说少了。你可以使用完全相同的图像,但声音会根据你加入的声音和音乐塑造出完全不同的氛围。”
他和他的联合创始人Florian Wenzel都是AI研究人员和音乐家,AI音乐生成已在Mirelo的路线图上。但Simon-Gabriel表示,Mirelo在音效方面看到了更大的需求拉力,部分原因是该领域的研究比其他AI领域少。
他指出:“在这里建立真正的护城河,然后从中获利会更容易。”
这对Mirelo来说可能是值得的。Simon-Gabriel拒绝透露其新的估值,但表示与先前未公开的种子前一轮融资相比,估值已“非常显著”地上涨。那轮融资由柏林公司Atlantic领投,后者也参与了本轮新融资,使Mirelo的总融资额达到4400万美元,帮助其缩小了资源差距。
这家初创公司还获得了天使投资人的支持,这些人对其实际技术提供了信誉,并可能开辟新的机遇,包括Mistral首席执行官Arthur Mensch、Hugging Face首席科学官Thomas Wolf、Fal.ai联合创始人Burkay Gur等。
尽管如此,该团队也意识到AI生成的视频可能不会长时间保持“沉默”。
例如,Gemini的视频生成器现在集成了由DeepMind的Veo 3.1视频到音频模型驱动的音轨。但Simon-Gabriel听起来反倒像是得到了印证。“现在,突然间,人们意识到,‘哦,也许我们应该添加声音。’但当然了,你应该添加一些。这有点像无声电影与有声电影的区别,对吧?这确实带来了巨大的不同!”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区