📢 转载信息

原文链接：https://www.ithome.com/0/889/888.htm

原文作者：IT之家

火山引擎震撼发布：豆包四大模型全面升级，语音合成与复刻能力实现质的飞跃

2025年10月16日，在武汉举行的 FORCE LINK AI 创新巡展上，火山引擎宣布了豆包大模型系列的重大更新。本次发布涵盖了豆包大模型 1.6 升级版、豆包大模型 1.6 lite（轻量版）、豆包语音合成模型 2.0 以及豆包声音复刻模型 2.0，标志着其在多模态和效率优化方面迈出坚实一步。

豆包大模型 1.6：原生支持“分档思考长度”

豆包大模型 1.6 首次原生支持四种不同的“思考长度”设置：Minimal、Low、Medium、High。这一创新设计允许企业根据不同应用场景对模型效果、响应时延和运行成本进行精细化平衡，是国内首个支持此功能的模型。

效率显著提升： 相比升级前的单一模式，新版 1.6 模型在效果不变的前提下，总输出 Tokens 下降了 77.5%，思考时间缩短了 84.6%。

豆包大模型 1.6 lite：更轻量、更具性价比

为了满足更多轻量化和高并发需求，火山引擎正式推出了豆包大模型 1.6 lite。它在推理速度和性价比方面表现突出：

性能超越： 效果上，1.6 lite 已经超越了此前的旗舰模型豆包大模型 1.5 pro，在企业级场景测评中提升了 14%。
成本优势： 在企业最常用的 0-32k 输入长度区间内，1.6 lite 的综合使用成本较 1.5 pro 降低了惊人的 53.3%。

语音合成与声音复刻 2.0：具备情感理解与公式朗读能力

豆包语音合成模型 2.0（Doubao-Seed-TTS 2.0）和声音复刻模型 2.0（Doubao-Seed-ICL 2.0）是本次发布的一大亮点。它们基于豆包大语言模型的新语音合成架构研发，实现了从单纯文本朗读到“理解后的精准情感表达”的进化：

深度语义理解： 合成和复刻的声音具备了上下文推理能力，能够理解文本深层含义。
精准可控性： 用户可以通过自然语言精确控制语速、情绪、声线、音调和风格的变化。
公式朗读突破： 针对教育和专业场景的优化，使得模型在朗读小学至高中阶段的全学科复杂公式时，准确率达到了 90%。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

重磅升级！豆包发布四大模型：支持情感理解、音调风格调节，精准朗读复杂公式

火山引擎震撼发布：豆包四大模型全面升级，语音合成与复刻能力实现质的飞跃

豆包大模型 1.6：原生支持“分档思考长度”

豆包大模型 1.6 lite：更轻量、更具性价比

语音合成与声音复刻 2.0：具备情感理解与公式朗读能力

评论区