目 录CONTENT

文章目录

美国AI初创公司Anthropic推出Claude 3.5 Sonnet模型,性能超越GPT-4o

Administrator
2026-01-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/ckgjedpn8p8o?at_medium=RSS&at_campaign=rss

原文作者:BBC News


Anthropic发布Claude 3.5 Sonnet,性能超越GPT-4o

人工智能初创公司Anthropic表示,其最新发布的Claude 3.5 Sonnet模型在多个行业基准测试中击败了OpenAI的GPT-4o。

Anthropic称,该模型在知识、推理和编码等方面的表现优于其竞争对手。

该公司还表示,Claude 3.5 Sonnet是其“迄今为止最快、最智能”的模型。

它被定位为“最适合企业使用”的模型,可以帮助用户完成更复杂的任务,例如软件开发和数据分析。

性能大幅提升

Anthropic在博客文章中称,Claude 3.5 Sonnet在各种推理、编码和知识测试中,比其前代Claude 3 Opus模型提高了2倍的性能。

它在MMLU(大规模多任务语言理解)基准测试中获得了86.8%的成绩,而GPT-4o的成绩为85.5%。

此外,在HumanEval编码测试中,Claude 3.5 Sonnet的得分为92.0%,而GPT-4o的得分是85.7%。

视觉能力增强

该公司还重点介绍了Claude 3.5 Sonnet在处理视觉任务上的进步,包括理解图表、解读图纸和处理复杂的图形信息。

为了展示其能力,Anthropic发布了一张图片,展示了Claude如何将一张手绘的网站草图转换成一个功能性的网页。

“我们构建Claude 3.5 Sonnet是为了在安全性能之间实现最佳平衡,”Anthropic在一篇博客文章中写道。

我们新的模型在各种能力上都比我们最强大的闭源模型Claude 3 Opus有了显著提升,并且在推理和编码方面超越了GPT-4o

Anthropic还推出了一个名为“Artifacts”的新功能,允许用户在Claude的聊天界面中查看和编辑模型生成的代码、文档或设计草图。

该公司表示,未来还将推出更强大的Claude 3.5 Sonnet模型。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区