火山引擎重磅发布：豆包大模型1.6升级，并推出语音合成/复刻2.0，支持情感理解与公式精准朗读-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://www.ithome.com/0/889/888.htm

原文作者：清源

# 火山引擎重磅发布：豆包大模型1.6升级，并推出语音合成/复刻2.0，支持情感理解与公式精准朗读 **IT之家 10 月 16 日消息**，在今日举行的 FORCE LINK AI 创新巡展・武汉站活动中，火山引擎一口气发布和升级了四款“豆包”大模型系列产品，旨在为企业用户提供更灵活、更专业、更具成本效益的AI解决方案。此次升级的核心包括：**豆包大模型 1.6 升级版**，原生支持四种思考长度；**豆包大模型 1.6 lite**、**豆包语音合成模型 2.0**，以及**豆包声音复刻模型 2.0** 完成了全新发布。 ## ▌ 豆包大模型 1.6 升级：实现“分档调节思考长度” 火山引擎的豆包大模型 1.6 实现了国内首创的“分档调节思考长度”功能，提供了 **Minimal、Low、Medium、High** 四种思考长度选项。这使得企业可以根据不同场景对模型效果、响应时延和运营成本的需求，进行灵活取舍。数据显示，相较于升级前的单一思考模式，升级后的豆包 1.6 模型在保持效果不变的前提下，总输出 Tokens 下降了 **77.5%**，思考时间也减少了 **84.6%**，效率得到极大提升。 ### 🚀 轻量级新星：豆包 1.6 lite 为了满足更轻量级的需求，官方正式推出了 **豆包大模型 1.6 lite**（Doubao-Seed-1.6-lite）。该模型推理速度更快，性价比更高，并且在企业级场景测评中，**效果超越了豆包大模型 1.5 pro**，提升了 14%。尤其是在企业最常用的 **0-32k 输入区间**，其综合使用成本相较于豆包 1.5 pro **降低了 53.3%**，为大规模应用提供了强有力的成本控制方案。

## ▌ 语音合成与复刻 2.0：进化为“理解后的精准表达” 本次发布的两大语音模型——**豆包语音合成模型 2.0**（Doubao-Seed-TTS 2.0）和**豆包声音复刻模型 2.0**（Doubao-Seed-ICL 2.0）迎来了重大革新。新模型基于豆包大语言模型研发的全新语音合成架构，使得合成和复刻的声音具备了**深度语义理解和上下文推理能力**，语音输出不再是简单的文本朗读，而是实现了“理解后的精准情感表达”。用户现在可以通过自然语言对语音参数进行**精准控制**，包括语速、情绪、声线、音调和风格变化，极大地增强了语音的可控性和表现力。 ### 🔬 惊人突破：公式朗读准确率达 90% 针对专业领域的应用，新语音模型进行了重点优化，特别是在复杂数学公式的朗读方面取得了显著成就。目前，在小学到高中阶段所有学科的复杂公式朗读测试中，**准确率达到了惊人的 90%**。广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

火山引擎重磅发布：豆包大模型1.6升级，并推出语音合成/复刻2.0，支持情感理解与公式精准朗读

评论区