目 录CONTENT

文章目录

性能比肩GPT-5,速度翻倍,价格更低!Anthropic 发布轻量级王牌模型 Claude Haiku 4.5

Administrator
2025-10-16 / 0 评论 / 0 点赞 / 9 阅读 / 0 字

📢 转载信息

原文链接:https://www.ifanr.com/1641081?utm_source=rss&utm_medium=rss&utm_campaign=

原文作者:莫崇宇


# Anthropic 发布 Claude Haiku 4.5:轻量级模型的新标杆 就在不久前,Anthropic 正式发布了其 Claude 家族的最新成员——**Claude Haiku 4.5**。 我们先简单回顾一下 Claude 模型家族的定位: * **Opus(大杯)**:顶级性能模型。 * **Sonnet(中杯)**:性能与效率的平衡点。 * **Haiku(小杯)**:追求极致速度和成本效益。 这次更新的重磅看点在于,**Haiku 4.5 在保持高水准模型性能的同时,实现了更快的速度和更低廉的价格。** 五个月前,Claude Sonnet 4 仍是行业前沿模型之一。而现在,新推出的 Haiku 4.5 在编码性能上几乎与 Sonnet 4 持平,但价格仅为后者的三分之一,速度却提升了两倍以上。

▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

## 编码性能直逼 GPT-5 在衡量 AI 编码能力的权威测试集 **SWE-bench Verified** 上,Haiku 4.5 取得了 73% 的优异成绩。这一表现意味着,**它直接与 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在了同一竞争水平线上。** 更有甚者,在某些任务(如电脑操控)方面,Haiku 4.5 甚至超越了老大哥 Sonnet 4。 对于需要 AI 处理实时、低延迟任务的场景——例如聊天助手、客服代理或结对编程助手——Haiku 4.5 凭借其高智能和出色速度,能够提供卓越的用户体验。使用 Claude Code 的开发者也会发现,从多智能体协作到快速原型开发,Haiku 4.5 让整个编程流程变得更加敏捷高效。 当然,两周前发布的 Sonnet 4.5 仍然是 Anthropic 的旗舰模型,位列全球编程模型的第一梯队。但 Haiku 4.5 提供了一个极具吸引力的替代方案:**性能接近顶配,价格却亲民得多。** 更有趣的是,新模型玩法更加灵活:**Sonnet 4.5 可以将复杂任务拆解成 N 个小任务,然后指挥一批 Haiku 4.5 并行处理,这种协同配合展现了极高的默契度。** ## 当前 Anthropic 中最安全可靠的模型 Anthropic 对 Haiku 4.5 进行了严格的安全性和对齐性测试。结果表明,该模型的不良行为发生率较低,并且其对齐性显著优于前代 Haiku 3.5。在自动化对齐评估中,Haiku 4.5 的总体偏离行为记录少于 Sonnet 4.5 和 Opus 4.1。 **换言之,Haiku 4.5 目前是 Anthropic 产品线中最安全可靠的模型。**

▲Comparison table of frontier models across popular benchmarks

## 价格与局限性分析 Haiku 4.5 的定价策略如下:每百万输入 Token 1 美元,每百万输出 Token 5 美元。 与其他主流模型相比: * **GPT-5 mini**:约 0.25 美元(输入)/ 2.5 美元(输出)。 * **Gemini 2.5 Flash**:价格相近。 这意味着 Haiku 4.5 的价格大约是 GPT-5 mini 或 Flash 的 4 倍。然而,与 Sonnet 4.5 相比,Haiku 4.5 便宜了约三倍,性能却几乎没有损失,这对开发者而言无疑是显著的降本增效。 **但需要注意的是,数学计算能力似乎不是它的强项。** 知名博主 Dan Shipper 在试用后指出,Haiku 在算术方面表现“迷糊”。例如,在处理 Uber 账单的测试中,Haiku 成功定位了所有相关邮件,但在计算总额时出现了错误。更令人意外的是,当被指出错误后,它虽然承认了,却在后续尝试中犯了同样的错误。 Dan Shipper 总结道: > 如果您是开发者或创业者,正在使用 Sonnet 4.5 构建复杂的智能代理应用,现在强烈建议切换到 Haiku。您将能节省大量成本,而性能损失几乎可以忽略不计。 > > 如果您目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议尝试 Haiku。尽管价格略高,但在需要调用工具和保持自主性的应用场景中,Haiku 的表现更胜一筹。

▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

## 生态布局与展望 目前,Claude Haiku 4.5 已在 Claude Code 和各类应用中全面上线。开发者可通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,将其直接替代 Haiku 3.5 和 Sonnet 4,并享受 Anthropic 最具竞争力的价格。 我们参考了@zb1992 的提示词,**让 Claude 4.5 Haiku 运行了一个钟表演示(Demo),整体体验下来,代码生成速度确实明显加快,最终生成结果也令人满意。** 在一个经典的推理计算题中,Claude 4.5 Haiku 的响应速度优势更为突出,这也正是轻量级模型在实际应用中的核心竞争力所在。 此外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近期已向投行顾问透露,计划通过收购引入更多技术人才,并拓展编程助手以外的能力领域,因为目前编程仍是其主要营收来源。 知情人士透露,鉴于 Anthropic 在编程类 AI 产品上取得的成功,公司下一步可能将业务扩展到其他开发者常用的软件工具,例如自动测试代码漏洞的工具或辅助软件设计的工具。 另有消息称,Anthropic 也可能通过收购开发面向金融服务、医疗保健或网络安全等特定行业的产品,不过他们似乎更倾向于交易金额在 5 亿美元以下的小型收购项目。 目前看来,在不断提升模型能力的同时,Anthropic 也在积极布局生态系统。AI 领域的激烈竞争,最终受益的将是开发者和用户——更强大的模型、更低廉的价格以及更丰富的选择。


🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区