目 录CONTENT

文章目录

Speechify 为其 Chrome 扩展程序新增语音输入和语音助手功能

Administrator
2025-11-26 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://speechify.com/2025/11/25/speechify-adds-voice-typing-and-voice-assistant-to-its-chrome-extension/

原文作者:TechCrunch


Speechify 传统上是一个帮助用户收听文章、PDF 和文档的工具。现在,该公司正在为其 Chrome 扩展程序 增加语音检测功能,包括语音输入和可回答问题的语音助手。

在过去 12 个月里,由于语音识别模型的整体质量得到提升,语音检测工具激增。Speechify 正在顺应这一趋势,推出支持英语的自有听写工具。与许多听写工具一样,Speechify 的语音输入功能可以纠正错误并去除填充词。

在我短暂的一天多的测试中,我感觉 Speechify 的工具仍有很大的改进空间。例如,该工具在 Gmail 和 Google Docs 等网站上运行良好,但在 WordPress 等网站上,我在触发语音听写并使其正常工作时遇到了困难。该公司表示,他们将逐步为热门网站添加优化。

图片来源:Speechify

在准确性方面,其词语错误率高于 Wispr Flow、Willow 和 Monologue 等其他工具。Speechify 指出,随着用户使用频率的增加,其模型学习得更快,错误率将逐步降低。

这家初创公司还推出了一个位于浏览器侧边栏的对话式语音助手。你可以就当前网站向它提问,例如“三个关键点是什么?”或“用更简单的术语解释一下”。

尽管 ChatGPT 和 Gemini 也有对话模式,但 Speechify 认为,在它们的应用程序中,语音功能被视为事后的补充。而这家初创公司自己的工具则将语音置于核心地位。

该公司首席商务官 Rohan Pavuluri 通过电子邮件告诉 TechCrunch:“我们相信,在 ChatGPT 和 Gemini 中,聊天将永远是默认的用户体验,因为这是它们用户所期望的。语音将永远是次要的——在很多情况下,对于 ChatGPT 和 Gemini 来说,语音只是事后才考虑的功能。我们从多年构建 Speechify 的经验中得知,市场上有很大一部分人(包括我们的用户)希望每次打开应用程序并与 AI 对话时,语音都是主要的、默认的设置。”

这项功能的一个显著限制是,Speechify 的助手目前不支持内置侧边栏助手的浏览器,例如 OpenAI 的 Atlas、Perplexity 的 Comet 和 Dia。但这家初创公司对此并不太担心,因为该扩展程序主要面向 Chrome 及其庞大的用户群。

Speechify 表示,他们计划逐步将语音输入和语音助手功能集成到其所有桌面和移动应用程序中。

这家初创公司还希望开发能够代表用户完成任务的 代理(agents)。该公司没有透露完整的路线图,但举了一个例子:为你打电话安排预约或在客户支持队列中等待。其他公司,如 Truecaller 和 Cloacked,也在追求类似的目标。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区