📢 转载信息
原文作者:Sarah Perez
人工智能音频公司 ElevenLabs 的联合创始人兼首席执行官 Mati Staniszewski 认为,AI 模型将随着时间推移而商品化,这对一家目前专注于构建这些模型 Thus 公司来说,是一个值得关注的言论。
周二在 TechCrunch Disrupt 2025 会议的舞台上,这位 ElevenLabs 的创始人讨论了他对 AI 音频领域的短期和长期看法。
Staniszewski 表示,他公司的研究人员已经能够攻克一些模型架构方面的挑战,并且这种专注将在未来一两年内继续在音频领域发挥作用。
Staniszewski 说:“从长远来看,它将会商品化——在未来几年内。”他补充道:“即使存在差异——我认为对于某些声音、某些语言来说这是事实——但就其本身而言,差异将会更小。”
当被问及如果他认为模型最终会商品化,为什么 ElevenLabs 还要专注于构建模型时,Staniszewski 解释说,在短期内,模型仍然是“今天你能拥有的最大优势和最大的变革”。
例如,如果 AI 语音或交互听起来不够好,这仍然是一个需要解决的问题。
Staniszewski 说:“解决这个问题的唯一方法是……自己构建模型,然后,从长远来看,也会有其他参与者来解决这个问题。”
他还指出,那些寻求可靠、可扩展用例的人可能仍然会针对不同的用例使用不同的模型。
然而,Staniszewski 表示,在未来一两年内,越来越多的模型将转向多模态或融合方法。
他说道:“因此,你将同时创建音频和视频,或者在对话场景中同时创建音频和大型语言模型(LLM),”他以谷歌的 Veo 3 为例,说明了当模型组合在一起时可以实现的效果。
这位创始人表示,ElevenLabs 计划与其它公司建立合作伙伴关系,并与开源技术合作,以探究公司如何将其音频专业知识与其它模型的专业知识相结合。
他表示,对于 ElevenLabs 而言,目标是同时专注于模型构建和应用,以创造长期价值。
他补充道:“就像软件和硬件是苹果公司的魔力一样,我们认为产品和 AI 将是创造最佳用例的魔力所在。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区