目 录CONTENT

文章目录

美国人工智能公司Anthropic发布Claude 3.5 Sonnet模型,性能超越GPT-4o

Administrator
2025-11-26 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/ce9d900zd58o?at_medium=RSS&at_campaign=rss

原文作者:BBC News


人工智能公司Anthropic发布了其最新的大语言模型Claude 3.5 Sonnet,该公司声称该模型在多项行业基准测试中,性能超越了竞争对手OpenAI的GPT-4o和Google的Gemini 1.5 Pro。

Anthropic在周三的一篇博客文章中宣布了这一消息,称Claude 3.5 Sonnet的推出,标志着该公司在AI领域取得了“重大进展”。

该模型目前已对所有Claude用户免费开放,但可以通过订阅服务访问更高级别的模型。

Anthropic表示,Claude 3.5 Sonnet在推理、编码、知识和视觉能力方面的表现,都超过了其最新的“顶级”模型Claude 3 Opus。

“Claude 3.5 Sonnet的基准测试成绩令人印象深刻,它在多个认知能力测试中的表现都优于我们目前最强大的模型。”Anthropic在博客中写道。

该公司还声称,该模型在视觉任务和理解复杂指令方面表现出色,并且在编码方面有显著的改进,尤其是在代码生成和错误修复方面。

Anthropic表示,它还推出了一个名为“Artifacts”的新功能,允许用户在聊天界面中查看、编辑和构建代码、文档或设计等内容。

“这使得用户可以更容易地与AI协作,直接在AI的输出中进行修改和迭代,从而提高工作效率。”

在过去一年里,Anthropic与OpenAI、Google和Meta等科技巨头在AI军备竞赛中展开激烈竞争。

Anthropic由前OpenAI员工创立,并获得了亚马逊和Google等公司的巨额投资。

其旗舰产品GPT-4o在五月份发布后,被认为是AI领域的领先模型之一,并在多项性能测试中超越了Claude 3系列模型。

目前,Anthropic的Claude 3.5 Sonnet旨在重新夺回领先地位。

科技分析师表示,这种快速迭代是AI行业竞争激烈的体现。

“我们看到的是一场持续的军备竞赛,每个公司都在努力超越对方,”一位科技分析师评论道。

“Anthropic的这一举动表明,他们正在努力保持竞争力,并在模型性能上实现快速迭代。”

然而,专家们提醒说,虽然基准测试结果很重要,但实际应用中的用户体验和模型在真实世界场景中的表现同样关键。

“基准测试可以提供一个很好的参考点,但最终决定模型好坏的是用户如何使用它,以及它在解决实际问题时的可靠性。”

Anthropic尚未公布下一代更强大的模型Claude 3.5 Opus的发布时间,但市场普遍预计,未来几周内将会有更多关于顶级模型的性能对比出现。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区