📢 转载信息
原文链接:https://www.bbc.com/news/articles/cjw983pvz6lo?at_medium=RSS&at_campaign=rss
原文作者:BBC News
谷歌(Google)和Anthropic这两家人工智能领域的巨头在同一天发布了各自最新的大型语言模型(LLM),展示了该领域正在经历的快速发展。
谷歌的DeepMind部门发布了Gemini 1.5 Pro,而Anthropic则发布了Claude 3.5 Sonnet。这两家公司都将模型的能力提升到了新的高度,尤其是在处理和理解超长信息方面。
谷歌的Gemini 1.5 Pro
谷歌展示的Gemini 1.5 Pro最大的亮点是其原生100万Token的上下文窗口,这比其竞争对手的上下文窗口要大得多。Token是模型用来处理文本的单元,可以大致理解为单词或字符的一部分。
这意味着Gemini 1.5 Pro可以一次性处理和分析大量的文本、代码或视频内容。
处理视频的能力
谷歌展示了该模型的一项令人印象深刻的能力:它可以处理大约1小时的视频,然后回答有关该视频的各种问题。例如,它可以根据视频中的视觉信息和音频线索进行总结或定位特定片段。
代码能力
在编码方面,谷歌声称Gemini 1.5 Pro在编码基准测试中的表现优于许多竞争对手。通过增加的上下文窗口,模型可以更好地理解复杂的代码库和项目结构。
Anthropic的Claude 3.5 Sonnet
与此同时,Anthropic发布了Claude 3.5 Sonnet。虽然其上下文窗口大小(约20万Token)小于谷歌的Gemini 1.5 Pro,但Anthropic声称Claude 3.5 Sonnet在多个关键认知基准测试中表现更优。
超越竞争对手
Anthropic表示,Claude 3.5 Sonnet在推理、知识和编码能力方面超越了OpenAI的GPT-4o和Gemini 1.5 Pro。
在一项评估模型解决复杂编程问题的能力的测试中,Claude 3.5 Sonnet获得了92.0%的得分,而GPT-4o的得分为86.7%,Gemini 1.5 Pro的得分为88.4%。
代码生成与推理
Anthropic的博客文章指出,Claude 3.5 Sonnet在代码生成方面也表现出色,它不仅能生成更准确的代码,还能更好地理解和修复现有代码中的错误。
此外,Anthropic还推出了一项名为Artifacts的新功能。它允许用户在模型生成代码或内容时,在侧边栏查看和迭代结果,这提供了一种更具交互性的工作流程。
AI领域的军备竞赛
这两项更新都表明,生成式AI领域的竞争正在加剧。模型在处理更长、更复杂的信息方面取得了进步,这对企业和开发者来说都是一个好消息。
随着上下文窗口的增加和模型精度的提高,AI系统有望在更复杂的任务中表现出更强大的能力,例如处理大型法律文件、分析复杂的科学数据集或在软件开发周期中提供更深入的帮助。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区