目 录CONTENT

文章目录

Meta 发布 Llama 3:性能飙升,支持更多应用场景

Administrator
2026-03-24 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://36kr.com/p/3736178996658435?f=rss

原文作者:36氪


Meta 发布 Llama 3:性能大幅提升,更广泛的应用场景

Meta 近日发布了其最新的大型语言模型 Llama 3,相较于前代产品,Llama 3 在性能上实现了显著的飞跃。此次更新不仅包括了模型规模的扩大,还针对多种任务进行了优化,使其在理解、生成和推理能力上都有了质的提升。

性能提升与模型架构

Llama 3 提供了 8B 和 70B 两种参数规模的模型,并且均有预训练和指令微调版本。Meta 表示,Llama 3 在语言理解、代码生成、逻辑推理等多个基准测试中,均超越了其竞争对手,甚至在某些方面逼近了业界顶尖水平。例如,在 Massive Multitask Language Understanding (MMLU) 基准测试中,Llama 3 8B 和 70B 的得分分别为 63.9% 和 82.0%,大幅领先于同等规模的其他模型。Meta 还透露,正在训练一个超过 4000 亿参数的 Llama 3 模型,该模型将具备更强大的能力,并计划在未来开源。

在模型架构方面,Llama 3 采用了新的分词器 (tokenizer),支持 128K 的上下文窗口,相较于 Llama 2 的 4K 有了显著的扩展,这意味着模型能够处理更长的文本输入,理解更复杂的语境。

广泛的应用场景

Llama 3 的发布预示着其将在更广泛的应用场景中发挥作用。Meta 正在将其集成到其一系列产品中,包括 Facebook、Instagram、WhatsApp 和 Messenger。用户可以通过 Meta AI 助手与 Llama 3 进行交互,获取信息、生成内容、进行创作等。此外,Meta 还将 Llama 3 开源,允许开发者和研究人员自由使用和部署,这将极大地促进 AI 技术的创新和普及。

Meta AI 团队的负责人在发布会上表示:“Llama 3 是我们迄今为止最强大、最开放的模型。我们相信,通过将其能力赋能给开发者和用户,可以加速 AI 技术的进步,并为社会带来更多价值。”

未来展望

Meta 表示,Llama 3 的发布只是一个开始,未来还将继续迭代和改进。除了更大规模的预训练模型之外,Meta 还计划在 Llama 3 中引入多模态能力,使其能够理解和生成图像、音频等多种形式的信息。这将进一步拓展 AI 的应用边界,为用户带来更丰富、更智能的交互体验。

Llama 3 的开源和广泛应用,无疑将为 AI 领域带来新的活力,并有望推动更多创新应用的涌现。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区