目 录CONTENT

文章目录

火山引擎重磅发布:豆包大模型1.6升级,并推出语音合成/复刻2.0,支持情感理解与公式精准朗读

Administrator
2025-10-17 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://www.ithome.com/0/889/888.htm

原文作者:清源


# 火山引擎重磅发布:豆包大模型1.6升级,并推出语音合成/复刻2.0,支持情感理解与公式精准朗读 **IT之家 10 月 16 日消息**,在今日举行的 FORCE LINK AI 创新巡展・武汉站活动中,火山引擎一口气发布和升级了四款“豆包”大模型系列产品,旨在为企业用户提供更灵活、更专业、更具成本效益的AI解决方案。 此次升级的核心包括:**豆包大模型 1.6 升级版**,原生支持四种思考长度;**豆包大模型 1.6 lite**、**豆包语音合成模型 2.0**,以及**豆包声音复刻模型 2.0** 完成了全新发布。 ## ▌ 豆包大模型 1.6 升级:实现“分档调节思考长度” 火山引擎的豆包大模型 1.6 实现了国内首创的“分档调节思考长度”功能,提供了 **Minimal、Low、Medium、High** 四种思考长度选项。这使得企业可以根据不同场景对模型效果、响应时延和运营成本的需求,进行灵活取舍。 数据显示,相较于升级前的单一思考模式,升级后的豆包 1.6 模型在保持效果不变的前提下,总输出 Tokens 下降了 **77.5%**,思考时间也减少了 **84.6%**,效率得到极大提升。 ### 🚀 轻量级新星:豆包 1.6 lite 为了满足更轻量级的需求,官方正式推出了 **豆包大模型 1.6 lite**(Doubao-Seed-1.6-lite)。该模型推理速度更快,性价比更高,并且在企业级场景测评中,**效果超越了豆包大模型 1.5 pro**,提升了 14%。 尤其是在企业最常用的 **0-32k 输入区间**,其综合使用成本相较于豆包 1.5 pro **降低了 53.3%**,为大规模应用提供了强有力的成本控制方案。 图片 ## ▌ 语音合成与复刻 2.0:进化为“理解后的精准表达” 本次发布的两大语音模型——**豆包语音合成模型 2.0**(Doubao-Seed-TTS 2.0)和**豆包声音复刻模型 2.0**(Doubao-Seed-ICL 2.0)迎来了重大革新。 新模型基于豆包大语言模型研发的全新语音合成架构,使得合成和复刻的声音具备了**深度语义理解和上下文推理能力**,语音输出不再是简单的文本朗读,而是实现了“理解后的精准情感表达”。 用户现在可以通过自然语言对语音参数进行**精准控制**,包括语速、情绪、声线、音调和风格变化,极大地增强了语音的可控性和表现力。 ### 🔬 惊人突破:公式朗读准确率达 90% 针对专业领域的应用,新语音模型进行了重点优化,特别是在复杂数学公式的朗读方面取得了显著成就。目前,在小学到高中阶段所有学科的复杂公式朗读测试中,**准确率达到了惊人的 90%**。 广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区