📢 转载信息
原文链接:https://www.ifanr.com/1641081?utm_source=rss&utm_medium=rss&utm_campaign=
原文作者:莫崇宇
Anthropic 刚刚发布了其最新的轻量级模型 Claude Haiku 4.5。Claude 家族目前包含三个版本:Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
Haiku 4.5:性能飞跃,成本骤降
本次更新的核心亮点在于,Haiku 4.5 在保持出色性能的同时,实现了速度的显著提升和成本的大幅下降。
与五个月前的 Claude Sonnet 4 相比,Haiku 4.5 在编码性能上几乎持平,但价格仅为其三分之一,速度却快了两倍多。
▲在衡量 AI 编码能力的 SWE-bench Verified 测试中,Haiku 4.5 的表现(来自图表)
编码能力媲美旗舰模型
在衡量 AI 编码能力的权威测试集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成绩,这使其直接与 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在了同一水平线上。在某些任务,如电脑操控方面,Haiku 4.5 甚至超越了 Sonnet 4。
对于需要实时、低延迟响应的场景,如聊天助手、客服代理或结对编程助手,Haiku 4.5 提供了高智能与出色速度的完美结合。
强大的模型协同能力
尽管 Sonnet 4.5 仍是 Anthropic 的旗舰模型,但 Haiku 4.5 提供了性价比极高的替代方案。更令人兴奋的是,Sonnet 4.5 具备“大模型能力”:它可以将复杂任务分解成多个小任务,然后指挥一群 Haiku 4.5 并行处理,这种协作配合非常高效。
安全性显著提升
Anthropic 对 Haiku 4.5 进行了严格的安全性和对齐性测试。结果显示,该模型的“不良行为”发生率较低,且对齐性相比前代 Haiku 3.5 有显著提高。在自动化对齐评估中,Haiku 4.5 的总体偏离行为少于 Sonnet 4.5 和 Opus 4.1,使其成为目前 Anthropic 产品线中最安全可靠的模型。
▲主流模型在各种基准测试中的对比(来自图表)
定价与性能权衡
Haiku 4.5 的定价为:每百万输入 Token 1 美元,每百万输出 Token 5 美元。
与 GPT-5 mini(约 0.25/2.5 美元)或 Gemini 2.5 Flash 相比,Haiku 4.5 的价格大约高出 4 倍,但相比 Sonnet 4.5 则便宜了约三倍,而性能几乎持平,对于开发者而言,这无疑是显著的成本优化。
数学能力仍是短板
然而,测试表明数学计算仍是 Haiku 4.5 的弱项。知名博主 Dan Shipper 发现,Haiku 在处理如 Uber 账单求和等算术任务时容易出错,甚至在被指出错误后仍可能重复犯错。
Dan Shipper 的建议是:
如果你是开发者或创业者,正在使用 Sonnet 4.5 构建复杂的智能代理应用,现在可以考虑切换到 Haiku。你能节省大量成本,而性能损失几乎可以忽略。
如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建议试试 Haiku。虽然价格更高一些,但在需要调用工具和保持自主性的场景中,它的表现更好。
▲博客源地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
生态布局与未来展望
Claude Haiku 4.5 现已通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台全面上线,开发者可将其用于替代 Haiku 3.5 和 Sonnet 4。
实测中,通过参考社区提示词让 Haiku 4.5 运行钟表 Demo,其代码生成速度确实更快,最终效果令人满意。在推理计算题的响应速度测试中,Haiku 4.5 的优势更为明显,突显了其在实际应用中的核心竞争力。
收购布局以拓展能力边界
据报道,估值高达 1700 亿美元的 Anthropic 近期正在与投行顾问接触,计划通过收购来引进更多技术人才,并拓展其业务范围,以期减少对编程助手这一当前主要营收来源的依赖。
知情人士透露,Anthropic 可能会将业务扩展到其他开发者常用的工具领域,例如自动测试代码漏洞或辅助软件设计工具。此外,公司也可能收购开发特定行业产品(如金融、医疗或网络安全)的公司,但更倾向于交易金额在 5 亿美元以下的小型收购。
Anthropic 在提升模型能力的同时积极布局生态,AI 领域的激烈竞争最终将为开发者和用户带来更强、更便宜、选择更多的优质产品。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区