目 录CONTENT

文章目录

Meta 宣布其最新的开源大语言模型 Llama 3.1,性能超越 GPT-4o 和 Claude 3 Opus

Administrator
2025-11-28 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://m.cnbeta.com.tw/view/1538338.htm

原文作者:CNBeta


Meta 今天宣布推出其最新的开源大型语言模型(LLM)Llama 3.1 系列,它在多项关键基准测试中超越了 GPT-4oClaude 3 Opus 等领先模型。

Llama 3.1 系列包括三个模型尺寸:8B70B405B

Meta 表示,Llama 3.1 模型在人工智能研究领域的一些最困难的基准测试中展示了前所未有的性能。

基准测试结果领先

Meta 在其发布的博客文章中详细介绍了 Llama 3.1 在 MMLU (大规模多任务语言理解)、GSM8K (数学推理) 和 HumanEval (代码生成) 等基准测试上的优异表现。

其中,Llama 3.1 405B 模型在 MMLU 上的得分超过了 GPT-4o 和 Claude 3 Opus,标志着开源模型在语言理解和推理能力方面达到了新的里程碑。

  • MMLU (大规模多任务语言理解):Llama 3.1 405B 在 MMLU 上的得分高于 GPT-4o 和 Claude 3 Opus。
  • 代码能力:在 HumanEval 等代码基准测试中,Llama 3.1 表现出显著提升,特别是 405B 版本,其性能接近甚至超越了某些专有模型的最新版本。
  • 推理优化:Llama 3.1 在数学和逻辑推理任务上的准确性也得到了加强。

改进的架构与安全防护

Llama 3.1 模型的训练基于 Llama 3 的架构,但在多个方面进行了改进和优化。

Meta 强调,Llama 3.1 在 推理速度安全防护 方面进行了大量优化。模型经过了更严格的安全对齐和红队测试,旨在减少有害输出并提高模型遵循指令的能力。

同时,Meta 改进了上下文窗口和指令遵循能力,使得模型在处理复杂、多步骤的任务时表现得更加可靠。

发布形式与可用性

Llama 3.1 系列模型均以 开源 形式发布,允许研究人员和开发者免费使用和修改。Meta 提供了预训练模型和指令微调(Instruct)版本,以满足不同应用场景的需求。

这些模型将通过 Meta 官方渠道以及各大云平台和模型库(如 Hugging Face)供用户下载使用。

Meta 表示,开源 Llama 3.1 有助于推动人工智能领域的创新,并确保 AI 技术的发展透明化和社区化。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区