目 录CONTENT

文章目录

美国人工智能公司Anthropic发布Claude 3.5 Sonnet模型

Administrator
2026-01-09 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.bbc.com/news/articles/c99kn52nx9do?at_medium=RSS&at_campaign=rss

原文作者:BBC News


Anthropic发布Claude 3.5 Sonnet,声称在多项测试中超越GPT-4o

人工智能公司Anthropic发布了其最新的大型语言模型Claude 3.5 Sonnet,并声称该模型在多项行业基准测试中表现优于OpenAI的GPT-4o和Google的Gemini 1.5 Pro

Anthropic表示,Claude 3.5 Sonnet在推理、编码、视觉理解和数学能力等方面的表现均超越了竞争对手的模型。

该公司在一份声明中称,这款新模型在复杂任务的处理能力上有了显著提升,并且运行速度比上一代Claude 3 Sonnet快了一倍。

Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)表示,该公司致力于以“最快速度”推进人工智能技术的发展,同时确保其产品是“有益、无害且诚实”的。

“我们正在努力推出我们认为是目前市场上最强大的基础模型。”阿莫代伊说。

新的视觉和编码能力

Claude 3.5 Sonnet在新的测试中表现出色,特别是在处理需要细致分析的视觉任务方面。

该公司展示了一个例子,Claude 3.5 Sonnet能够通过查看一个网站设计图的草图,并立即生成功能齐全的网页代码。

“这不仅仅是代码生成,”Anthropic的首席科学家兼联合创始人克劳迪娅·克拉夫特(Claudia Clave)在一次采访中说。“这是关于理解视觉输入,并将其转化为有意义的、可操作的输出的能力。”

同时,Anthropic还发布了“Artifacts”功能,该功能允许用户在聊天界面中看到模型生成的内容,如代码或文档,并在不中断对话的情况下对其进行实时修改。

该功能类似于OpenAI的GPTs或Google的Gemini界面,旨在提供更具沉浸感和协作性的AI使用体验。

模型的性能与发布时间

Anthropic声称,Claude 3.5 Sonnet在多个技术基准测试(如MMLUGPQAHumanEval)中均取得了当前最佳成绩。

这些模型通常通过向用户展示一系列复杂的问题来评估其能力,其中一些问题需要高级的推理能力。

Anthropic表示,Claude 3.5 Sonnet现在已对所有Claude Pro订阅用户免费开放,并且将很快向Claude TeamEnterprise用户推出。

该公司还宣布,其更强大的模型Claude 3 Opus将很快获得升级,以匹配或超越Claude 3.5 Sonnet的性能。

同时,较小的模型Claude 3 Haiku也将进行更新,使其具备更强的视觉能力。

Anthropic表示,这些更新旨在通过提供更强大的模型组合来满足不同用户的需求,从速度优先到最复杂任务处理。

人工智能领域的竞争日益激烈,OpenAI和Google也在不断推出新的、更先进的模型,以争夺市场领导地位。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区