目 录CONTENT

文章目录

Cohere 发布开源语音模型 Transcribe,助力高效语音转写

Administrator
2026-03-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/03/26/cohere-launches-an-open-source-voice-model-specifically-for-transcription/

原文作者:Ivan Mehta


企业级 AI 公司 Cohere 于周四发布了其首款语音模型:Transcribe。这是一个开源的自动语音识别(ASR)模型,专门用于笔记记录、语音分析等任务。

轻量高效的开源模型

该模型参数量相对轻盈,仅为 20 亿(2 billion)参数,专为那些希望进行本地化部署且拥有消费级 GPU 的用户设计。目前,它支持包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、希腊语、荷兰语、波兰语、中文、日语、韩语、越南语和阿拉伯语在内的 14 种语言。

Cohere 表示,在 Hugging Face 开放 ASR 排行榜上,Transcribe 的表现超越了 Zoom Scribe v1、IBM Granite 4.0 1B、ElevenLabs Scribe v2 以及 Qwen3-ASR-1.7B Speech 等模型,其平均单词错误率(WER)仅为 5.42,是该基准测试中表现最出色的模型。

性能与局限性

据公司宣称,在人类评估员对转写内容的准确性、连贯性和可用性进行评估时,Transcribe 相比其他模型拥有 61% 的平均胜率。不过,该模型在处理葡萄牙语、德语和西班牙语的转写任务时,表现略逊于竞争对手。

Cohere 指出,Transcribe 处理音频的效率极高,每分钟可处理 525 分钟的音频,这在同类模型中处于领先水平。

未来规划

该公司计划将 Transcribe 集成到其企业代理编排平台 North 中,并免费通过其 API 提供该模型。此外,该模型也将在 Cohere 的托管推理平台 Model Vault 上线。

随着 Granola 和 Wispr Flow 等语音笔记与听写应用的需求日益增长,语音识别模型正变得越来越受欢迎。

据报道,今年早些时候,Cohere 向投资者透露其 2025 年的年度经常性收入(ARR)达到 2.4 亿美元,其首席执行官 Aidan Gomez 曾表示,该公司可能“很快”会上市




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区