目 录CONTENT

文章目录

Anthropic重磅发布Claude Haiku 4.5:性能追平五个月前的旗舰模型,成本仅为其三分之一

Administrator
2025-10-17 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

📢 转载信息

原文链接:https://arstechnica.com/ai/2025/10/anthropics-claude-haiku-4-5-matches-mays-frontier-model-at-fraction-of-cost/

原文作者:Benj Edwards


Anthropic Claude Haiku 4.5重磅登场:性能直逼旧旗舰,成本大幅降低

周三,Anthropic 发布了 Claude Haiku 4.5,这是一款小型AI语言模型。据称,它的性能已经达到了其旗舰模型 Claude Sonnet 4 五个月前所能达到的水平,但成本仅为其三分之一,速度却提升了一倍以上。该新模型现已对所有Claude应用、网页和API用户开放。

如果Anthropic报告的Haiku 4.5基准测试数据经得起独立检验,那么该公司仅用五个月时间,就以显著的速度提升和成本削减,匹配了其前沿(2025年5月)的编码模型(以及GPT-5在编码方面的能力),这无疑是一个重要的里程碑。

Claude模型家族的定位与知识蒸馏的威力

回顾一下,Anthropic的Claude系列模型分为三个尺寸:Haiku(小型)、Sonnet(中型)和Opus(大型)。较大的模型基于更庞大的神经网络,通常包含更深层次的上下文知识,但运行速度较慢且成本更高。通过一种被称为知识蒸馏的技术,Anthropic等公司能够打造出在编码等功能性任务上能力媲美旧款大型模型的小型AI模型,尽管这通常是以牺牲部分存储知识为代价的。

Claude 4.5 Haiku benchmark results from Anthropic.
Claude 4.5 Haiku 基准测试结果(来自Anthropic)。

这意味着,如果你需要一个模型来对外交政策或世界历史进行更深入、更有意义的分析,你可能会更倾向于使用Sonnet或Opus(同时也要意识到它们也可能犯错甚至编造事实)。但如果你只是需要快速的代码辅助,重点在于概念转换而非广博的通用知识,那么由于其速度和成本优势,Haiku可能是更好的选择。

API定价与实时任务的理想选择

谈到成本,Haiku 4.5已包含在Claude网页和应用订阅计划中。对于开发者通过API调用,该小型模型的定价为每百万输入Token 1美元,每百万输出Token 5美元。相比之下,Sonnet 4.5的定价为每百万输入3美元,每百万输出15美元;而Opus 4.1的定价则为每百万输入15美元,每百万输出75美元。

Haiku 4.5可作为Haiku 3.5和Sonnet 4两款旧模型的低成本替代品。“依赖AI进行实时、低延迟任务的用户,例如聊天助手、客服代表或结对编程,将会欣赏Haiku 4.5结合了高智能与非凡速度的特性,”Anthropic在官网上写道

Claude 4.5 Haiku answers the classic Ars Technica AI question, "Would the color be called ‘magenta’ if the town of Magenta didn’t exist?”
Claude 4.5 Haiku 回答了 Ars Technica 的经典AI问题:“如果Magenta这个城镇不存在,这种颜色还会叫‘洋红色’吗?”

在衡量编码任务性能的SWE-bench Verified测试中,Haiku 4.5得分73.3%,与Sonnet 4的相近表现(72.7%)不相上下。根据Anthropic的基准测试,该模型在某些任务上(如使用计算机)也据称超越了Sonnet 4。Anthropic于9月下旬发布的Claude Sonnet 4.5,仍是该公司的前沿模型,被认为是“目前最好的编码模型”。

Haiku 4.5在上述特定基准测试中,令人意外地接近了OpenAI的GPT-5所能达到的水平(如上图所示)。但由于结果是自报的,并且可能经过精心挑选以突出模型的优势,因此用户始终应持保留态度。

赋能复杂的多模型工作流

尽管如此,打造一个小型且高效的编码模型,可能为像Claude Code这样的智能体编码设置带来意想不到的优势。Anthropic设计Haiku 4.5就是为了与Sonnet 4.5在多模型工作流中协同工作。在这种配置下,Anthropic表示,Sonnet 4.5可以分解复杂的任务并制定多步骤计划,然后协调多个Haiku 4.5实例并行完成子任务,就像指派工人一样,以更快地完成工作。

有关新模型的更多细节,Anthropic发布了系统卡以及面向开发者的文档




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区