📢 转载信息
原文链接:https://www.ifanr.com/1641081?utm_source=rss&utm_medium=rss&utm_campaign=
原文作者:莫崇宇
# Anthropic 发布 Claude Haiku 4.5:轻量级模型的新标杆 就在不久前,Anthropic 正式发布了其 Claude 家族的最新成员——**Claude Haiku 4.5**。 我们先简单回顾一下 Claude 模型家族的定位: * **Opus(大杯)**:顶级性能模型。 * **Sonnet(中杯)**:性能与效率的平衡点。 * **Haiku(小杯)**:追求极致速度和成本效益。 这次更新的重磅看点在于,**Haiku 4.5 在保持高水准模型性能的同时,实现了更快的速度和更低廉的价格。** 五个月前,Claude Sonnet 4 仍是行业前沿模型之一。而现在,新推出的 Haiku 4.5 在编码性能上几乎与 Sonnet 4 持平,但价格仅为后者的三分之一,速度却提升了两倍以上。
▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks
当然,两周前发布的 Sonnet 4.5 仍然是 Anthropic 的旗舰模型,位列全球编程模型的第一梯队。但 Haiku 4.5 提供了一个极具吸引力的替代方案:**性能接近顶配,价格却亲民得多。** 更有趣的是,新模型玩法更加灵活:**Sonnet 4.5 可以将复杂任务拆解成 N 个小任务,然后指挥一批 Haiku 4.5 并行处理,这种协同配合展现了极高的默契度。** ## 当前 Anthropic 中最安全可靠的模型 Anthropic 对 Haiku 4.5 进行了严格的安全性和对齐性测试。结果表明,该模型的不良行为发生率较低,并且其对齐性显著优于前代 Haiku 3.5。在自动化对齐评估中,Haiku 4.5 的总体偏离行为记录少于 Sonnet 4.5 和 Opus 4.1。 **换言之,Haiku 4.5 目前是 Anthropic 产品线中最安全可靠的模型。**
▲Comparison table of frontier models across popular benchmarks
▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
我们参考了@zb1992 的提示词,**让 Claude 4.5 Haiku 运行了一个钟表演示(Demo),整体体验下来,代码生成速度确实明显加快,最终生成结果也令人满意。** 在一个经典的推理计算题中,Claude 4.5 Haiku 的响应速度优势更为突出,这也正是轻量级模型在实际应用中的核心竞争力所在。
此外,据 The Information 报道,估值高达 1700 亿美元的 Anthropic 近期已向投行顾问透露,计划通过收购引入更多技术人才,并拓展编程助手以外的能力领域,因为目前编程仍是其主要营收来源。
知情人士透露,鉴于 Anthropic 在编程类 AI 产品上取得的成功,公司下一步可能将业务扩展到其他开发者常用的软件工具,例如自动测试代码漏洞的工具或辅助软件设计的工具。 另有消息称,Anthropic 也可能通过收购开发面向金融服务、医疗保健或网络安全等特定行业的产品,不过他们似乎更倾向于交易金额在 5 亿美元以下的小型收购项目。 目前看来,在不断提升模型能力的同时,Anthropic 也在积极布局生态系统。AI 领域的激烈竞争,最终受益的将是开发者和用户——更强大的模型、更低廉的价格以及更丰富的选择。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区