目 录CONTENT

文章目录

Subtle Computing 的语音隔离模型助力电脑在嘈杂环境中也能理解你

Administrator
2025-11-07 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2025/11/06/subtle-computings-voice-isolation-models-help-computers-understand-you-in-noisy-environments/

原文作者:Ivan Mehta


总部位于加州的初创公司 Subtle Computing 正在利用其专有的语音隔离模型,解决在嘈杂环境中捕捉人声的问题——这项技术可能会使基于语音的 AI 产品和服务受益。

如今,使用语音 AI 的消费者应用正经历着巨大的增长。像 GranolaFirefliesFathomRead AI 这样的 AI 会议记录工具获得了用户和投资者的关注。像 OpenAIClickUpNotion 等现有公司已经集成了语音转录解决方案。Wispr Flow 和 Willow 等应用开发者正在开发语音听写功能。此外,像 PlaudSandbar 等硬件公司正利用设备作为媒介来转录你的语音,然后利用 AI 进行洞察生成和交互。

这些公司面临的一个挑战是在任何环境中(例如嘈杂的咖啡馆或办公室)捕获用户的声音。

为了解决这个问题,Subtle Computing 开发了一个端到端的语音隔离模型,即使在嘈杂的环境中也能理解你在说什么。陈(Chen)表示,有很多公司都在研究语音理解。他指出,有时设备制造商会将语音发送到云端以获得干净的输出,但这效率不高。

这家初创公司会训练特定的模型来适应特定设备声学环境,并适应用户的声音,而不是训练一个适用于所有设备的通用模型。

陈说:“我们发现,当我们保留设备的声学特性时,性能比通用解决方案要好一个数量级。这也意味着我们可以为用户提供个性化的解决方案。”

该公司由 Tyler Chen、David Harrison、Savannah Cofer 和 Jackie Yang 创立,他们在斯坦福大学相识。Chen、Cofer 和 Yang 正在攻读博士学位,而 Harrison 则在攻读 MBA。他们在 Steve Blank 的精益启动课程(Lean Launchpad course)上相聚,并在那里研究了计算的替代接口,并开始创建 Subtle Computing。

陈说:“随着我们与 AI 的互动越来越多,我们正朝着与设备对话的未来迈进。”他补充道:“但显而易见的问题是,在我们的日常工作环境中,设备能理解我们用户的程度如何。无论是在超级吵闹的咖啡店,还是在有其他人在场的共享办公室,而且你可能在谈论私密的事情——今天的语音技术无法做到这一点。”

这家初创公司表示,它可以在某些设备上仅运行语音隔离模型,该模型体积仅有几兆字节,延迟为 100 毫秒。对于其他设备,该公司也可以运行一个不同的模型来转录语音并提供文本输出。陈表示,由于其隔离模型,公司的转录模型能更好地理解用户,从而产生更准确的文本记录。

Subtle Computing 表示,高通(Qualcomm)已选择该公司作为其语音和音乐扩展计划的成员。这意味着该初创公司的技术将兼容高通的芯片,并可在 OEM 制造的设备上使用。

该公司已筹集到 600 万美元的种子资金,由 Entrada Ventures 领投,Amplify Partners、Abstract Ventures 以及 Twitter 的 Biz Stone、Pinterest 的 Evan Sharp 和 Perplexity 的 Johnny Ho 等天使投资人参与跟投。

Entrada Ventures 的管理合伙人兼 X(Alphabet)早期项目的董事 Karen Roter Davis 指出,语音 AI 是一个嘈杂的领域,尽管通过该媒介的互动正在增加,但整体的语音体验并不理想。她认为,这家初创公司专注于语音隔离为市场带来了不同的视角。

Davis 说:“虽然你可以争论 AI 是会增加还是减少日常花费的时间,但我们都同意,计算能力和机器学习/AI 的进步为语音界面突破提供了机会——如果做得对的话。”她补充道:“Subtle Computing 在人们使用语音界面时与他们相遇,这些界面在极端噪音和极端安静的环境中都能保持稳定,提供可靠、简单、有趣的语音体验。这是一个改变游戏规则的技术。”

该公司表示,它还与一家消费硬件品牌和一家汽车品牌——在未透露名称的情况下——合作部署其解决方案。但 Subtle Computing 不想仅仅成为其他公司的模型供应商。

这家初创公司还表示,计划在明年发布一款涵盖硬件和软件的消费者产品,但未透露具体细节。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区