📢 转载信息
原文链接:https://simonwillison.net/2025/Oct/15/claude-haiku-45/#atom-everything
原文作者:Simon Willison
Anthropic 推出 Claude Haiku 4.5:速度与成本的优化升级
Anthropic 今日发布了 Claude Haiku 4.5,这是 Claude 4.5 系列中定位最经济的成员(该系列前几周由 Sonnet 4.5 开启)。
价格与定位
Haiku 4.5 的定价为每百万输入 Token 1 美元,每百万输出 Token 5 美元。虽然这比前代 Haiku 3.5($0.80/$4)略贵,但仍远低于初代 Claude 3 Haiku($0.25/$1.25)。有趣的是,Haiku 3.5 和初代 Haiku 仍以其旧价格继续提供。
值得注意的是,Haiku 4.5 的价格仅为 Sonnet 4 和 Sonnet 4.5(均为 $3/$15)的三分之一。尽管如此,Anthropic 的基准测试显示,Haiku 4.5 在性能上与较早的 Sonnet 4 模型处于同一水平。Anthropic 官方表示:
“五个月前处于前沿的模型,现在变得更便宜、更快了。今天,Claude Haiku 4.5 提供了与 Claude Sonnet 4 相似的编码性能,但成本仅为其三分之一,速度却快了一倍多。”
与竞争对手的对比
我一直期待 Anthropic 能推出一款在价格上能与 OpenAI (GPT-5-Nano, $0.05/$0.40) 和 Gemini (Gemini 2.0 Flash Lite, $0.075/$0.30) 最便宜模型竞争的快速、低成本模型。Haiku 4.5 显然还未达到这个水平,Anthropic 似乎仍然将重点放在“精通代码”的市场领域。
关键技术升级
新的 Haiku 是首个支持推理(reasoning)能力的 Haiku 模型。它拥有一个 200,000 Token 的上下文窗口,最大输出限制为 64,000 Token(远高于 Haiku 3.5 的 8,192 Token)。此外,它的“可靠知识截止日期”为 2025 年 2 月,比 Sonnet 4/4.5 和 Opus 4/4.1 的 2025 年 1 月稍新。
我在随附的 系统卡中注意到了一个关于上下文长度的有趣说明:
“对于 Claude Haiku 4.5,我们专门训练模型使其具备上下文感知能力,并能精确了解上下文窗口已使用了多少空间。这带来了两个效果:模型学会了在接近限制时如何收尾其答案;以及在限制距离较远时,模型学会了更持久地进行推理。我们发现,这项干预(以及其他干预)能有效限制智能体行为的‘惰性’(即模型过早停止工作、提供不完整答案或在任务上偷工减料的现象)。”
工具更新与演示
我已经将新价格添加到 llm-prices.com,并发布了支持新模型的 llm-anthropic 0.20。同时,我的 Haiku-from-your-webcam 演示(源码)也已更新为使用 Haiku 4.5。
以下是使用命令 llm -m claude-haiku-4.5 'Generate an SVG of a pelican riding a bicycle'
生成的内容(转录稿):
18 个输入 Token 和 1513 个输出 Token 耗费的总费用约为 0.7583 美分。
发布于 2025 年 10 月 15 日 下午 7:36
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区