📢 转载信息
原文链接:https://www.bbc.com/news/articles/ckgjedpn8p8o?at_medium=RSS&at_campaign=rss
原文作者:BBC News
Anthropic发布Claude 3.5 Sonnet,性能超越GPT-4o
人工智能初创公司Anthropic表示,其最新发布的Claude 3.5 Sonnet模型在多个行业基准测试中击败了OpenAI的GPT-4o。
Anthropic称,该模型在知识、推理和编码等方面的表现优于其竞争对手。
该公司还表示,Claude 3.5 Sonnet是其“迄今为止最快、最智能”的模型。
它被定位为“最适合企业使用”的模型,可以帮助用户完成更复杂的任务,例如软件开发和数据分析。
性能大幅提升
Anthropic在博客文章中称,Claude 3.5 Sonnet在各种推理、编码和知识测试中,比其前代Claude 3 Opus模型提高了2倍的性能。
它在MMLU(大规模多任务语言理解)基准测试中获得了86.8%的成绩,而GPT-4o的成绩为85.5%。
此外,在HumanEval编码测试中,Claude 3.5 Sonnet的得分为92.0%,而GPT-4o的得分是85.7%。
视觉能力增强
该公司还重点介绍了Claude 3.5 Sonnet在处理视觉任务上的进步,包括理解图表、解读图纸和处理复杂的图形信息。
为了展示其能力,Anthropic发布了一张图片,展示了Claude如何将一张手绘的网站草图转换成一个功能性的网页。
“我们构建Claude 3.5 Sonnet是为了在安全和性能之间实现最佳平衡,”Anthropic在一篇博客文章中写道。
我们新的模型在各种能力上都比我们最强大的闭源模型Claude 3 Opus有了显著提升,并且在推理和编码方面超越了GPT-4o。
Anthropic还推出了一个名为“Artifacts”的新功能,允许用户在Claude的聊天界面中查看和编辑模型生成的代码、文档或设计草图。
该公司表示,未来还将推出更强大的Claude 3.5 Sonnet模型。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区