📢 转载信息
原文链接:https://www.ithome.com/0/889/888.htm
原文作者:IT之家
火山引擎震撼发布:豆包四大模型全面升级,语音合成与复刻能力实现质的飞跃
2025年10月16日,在武汉举行的 FORCE LINK AI 创新巡展上,火山引擎宣布了豆包大模型系列的重大更新。本次发布涵盖了豆包大模型 1.6 升级版、豆包大模型 1.6 lite(轻量版)、豆包语音合成模型 2.0 以及豆包声音复刻模型 2.0,标志着其在多模态和效率优化方面迈出坚实一步。
豆包大模型 1.6:原生支持“分档思考长度”
豆包大模型 1.6 首次原生支持四种不同的“思考长度”设置:Minimal、Low、Medium、High。这一创新设计允许企业根据不同应用场景对模型效果、响应时延和运行成本进行精细化平衡,是国内首个支持此功能的模型。
- 效率显著提升: 相比升级前的单一模式,新版 1.6 模型在效果不变的前提下,总输出 Tokens 下降了 77.5%,思考时间缩短了 84.6%。
豆包大模型 1.6 lite:更轻量、更具性价比
为了满足更多轻量化和高并发需求,火山引擎正式推出了豆包大模型 1.6 lite。它在推理速度和性价比方面表现突出:
- 性能超越: 效果上,1.6 lite 已经超越了此前的旗舰模型豆包大模型 1.5 pro,在企业级场景测评中提升了 14%。
- 成本优势: 在企业最常用的 0-32k 输入长度区间内,1.6 lite 的综合使用成本较 1.5 pro 降低了惊人的 53.3%。
语音合成与声音复刻 2.0:具备情感理解与公式朗读能力
豆包语音合成模型 2.0(Doubao-Seed-TTS 2.0)和声音复刻模型 2.0(Doubao-Seed-ICL 2.0)是本次发布的一大亮点。它们基于豆包大语言模型的新语音合成架构研发,实现了从单纯文本朗读到“理解后的精准情感表达”的进化:
- 深度语义理解: 合成和复刻的声音具备了上下文推理能力,能够理解文本深层含义。
- 精准可控性: 用户可以通过自然语言精确控制语速、情绪、声线、音调和风格的变化。
- 公式朗读突破: 针对教育和专业场景的优化,使得模型在朗读小学至高中阶段的全学科复杂公式时,准确率达到了 90%。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区