目 录CONTENT

文章目录

Meta Llama全解析:关于这款开源生成式AI模型你需要知道的一切

青云TOP
2025-10-07 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2025/10/06/meta-llama-everything-you-need-to-know-about-the-open-generative-ai-model/

原文作者:Kyle Wiggers, Rebecca Bellan


Meta Llama:关于这款开源生成式AI模型,你需要了解的一切

与时下所有科技巨头一样,Meta 也有自己的旗舰生成式AI模型,名为 Llama。在主流模型中,Llama 具有一定的独特性,因为它被定位为“开放”模型,这意味着开发者可以按照自己的意愿(在特定限制下)下载和使用它。这与只能通过 API 访问的模型(如 Anthropic 的 Claude、Google 的 Gemini、xAI 的 Grok 以及 OpenAI 的大多数 ChatGPT 模型)形成了鲜明对比。

然而,为了给予开发者更多选择,Meta 也与 AWS、Google Cloud 和 Microsoft Azure 等供应商合作,提供云托管版本的 Llama。此外,该公司还在其 Llama Cookbook 中发布工具、库和“配方”,以帮助开发者对模型进行微调、评估和适应其特定领域。随着 Llama 3 和 Llama 4 等较新一代模型的推出,这些功能已扩展到包括原生的多模态支持和更广泛的云部署。

Llama illustration
图片来源:Larysa Amosova via Getty

以下是关于 Meta 的 Llama,从其能力、版本到使用地,你需要了解的全部信息。我们将随着 Meta 发布升级和引入新的开发工具来支持该模型的应用而持续更新此文。

什么是 Llama?

Llama 是一个模型家族,而不仅仅是单个模型。最新版本是Llama 4,于 2025 年 4 月发布,包含三个模型:

  • Scout:170 亿活跃参数,1090 亿总参数,上下文窗口为 1000 万个 token。
  • Maverick:170 亿活跃参数,4000 亿总参数,上下文窗口为 100 万个 token。
  • Behemoth:尚未发布,但将拥有 2880 亿活跃参数和 2 万亿总参数。

(在数据科学中,Token 是原始数据的细分部分,例如单词“fantastic”中的“fan”、“tas”和“tic”。)

模型的上下文,即上下文窗口,是指模型在生成输出(例如附加文本)之前会考虑的输入数据(例如文本)。长的上下文可以防止模型“忘记”近期文档和数据的核心内容,避免偏离主题和错误推断。然而,更长的上下文窗口也可能导致模型“忘记”某些安全护栏,并更倾向于产生与当前对话一致的内容,这可能使一些用户走向妄想状态

作为参考,Llama 4 Scout 承诺的 1000 万上下文窗口大约相当于 80 本普通小说的文本量。Llama 4 Maverick 的 100 万上下文窗口则相当于大约 8 本小说。

加入 Disrupt 2025,与 10K+ 科技和风险投资领袖共同成长与连接

Netflix、Box、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khosla——仅是 250 多家重量级公司中的一部分,他们将主导 200 多场会议,旨在提供助推初创企业成长和磨砺您优势所需的洞察力。不要错过 TechCrunch 20 周年庆典,以及向科技界顶级声音学习的机会。在门票售罄前抢购门票,最高可节省 444 美元。

加入 Disrupt 2025,与 10K+ 科技和风险投资领袖共同成长与连接

Netflix、Box、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil、Vinod Khosla——仅是 250 多家重量级公司中的一部分,他们将主导 200 多场会议,旨在提供助推初创企业成长和磨砺您优势所需的洞察力。不要错过向科技界顶级声音学习的机会。在门票售罄前抢购门票,最高可节省 444 美元。

旧金山 | 2025 年 10 月 27-29 日

据 Meta 称,所有 Llama 4 模型均使用“大量的未标记文本、图像和视频数据”进行训练,以赋予它们“广泛的视觉理解能力”,并且涵盖了 200 种语言。

Llama 4 Scout 和 Maverick 是 Meta 首批原生的、开源权重的多模态模型。它们采用“混合专家”(MoE)架构构建,该架构可减少计算负载并提高训练和推理效率。例如,Scout 有 16 个专家,而 Maverick 有 128 个专家。

Llama 4 Behemoth 包含 16 个专家,Meta 将其视为较小模型的“教师”模型。

图片来源:Artificial Analysis

Llama 4 建立在 Llama 3 系列之上,该系列包括广泛用于指令调优应用和云部署的 3.1 和 3.2 模型。

Llama 能做什么?

像其他生成式 AI 模型一样,Llama 可以执行各种辅助任务,例如编码和回答基本的数学问题,以及总结至少 12 种语言的文档(阿拉伯语、英语、德语、法语、印地语、印度尼西亚语、意大利语、葡萄牙语、泰语和越南语)。大多数基于文本的工作负载——比如分析 PDF 和电子表格等大型文件——都在其能力范围内,并且所有 Llama 4 模型都支持文本、图像和视频输入。

Llama 4 Scout 专为更长的工作流程和海量数据分析而设计。Maverick 是一个通才模型,在推理能力和响应速度之间取得了更好的平衡,适用于编码、聊天机器人和技术助手。而 Behemoth 专为高级研究、模型蒸馏和 STEM 任务而设计。

Llama 模型(包括 Llama 3.1)可以配置为利用第三方应用程序、工具和 API 来执行任务。它们经过训练,可以使用 Brave Search 回答有关最新事件的问题;使用 Wolfram Alpha API 处理与数学和科学相关的查询;以及使用 Python 解释器来验证代码。但是,这些工具需要正确的配置,并且不能开箱即用。

我可以在哪里使用 Llama?

如果你只是想与 Llama 聊天,它正在为 40 个国家的 Facebook Messenger、WhatsApp、Instagram、Oculus 和 Meta.ai 上的Meta AI 聊天体验提供支持。经过微调的 Llama 版本在 200 多个国家和地区用于 Meta AI 体验。

Llama 4 的 Scout 和 Maverick 模型可在 Llama.com 和 Meta 的合作伙伴(包括 AI 开发者平台 Hugging Face)上使用。Behemoth 仍在训练中。使用 Llama 进行构建的开发人员可以在大多数流行的云平台上下载、使用或微调该模型。Meta 声称拥有超过 25 个托管 Llama 的合作伙伴,包括 Nvidia、Databricks、Groq、Dell 和 Snowflake。虽然“向使用 Meta 开放的模型销售访问权限”不是 Meta 的商业模式,但该公司通过与模型托管方的收入分成协议赚取了一些收入。

其中一些合作伙伴在 Llama 的基础上构建了额外的工具和服务,包括允许模型引用专有数据并以较低延迟运行的工具。

重要的是,Llama 许可证限制了开发人员部署模型的方式:月活跃用户超过 7 亿的应用程序开发者必须向 Meta 申请特殊许可证,该公司将酌情授予。

Kyle Wiggers
图片来源:Kyle Wiggers

2025 年 5 月,Meta 启动了一项新计划,以激励初创公司采用其 Llama 模型。Llama for Startups 为公司提供 Meta Llama 团队的支持以及潜在的资金机会。

Meta 为 Llama 提供了哪些工具?

与 Llama 一起,Meta 还提供了旨在使模型使用起来“更安全”的工具:

  • Llama Guard,一个审核框架。
  • CyberSecEval,一套网络安全风险评估工具。
  • Llama Firewall,一个旨在支持构建安全 AI 系统的安全护栏。
  • Code Shield,为 LLM 生成的不安全代码提供推理时过滤支持。

Llama Guard 试图检测输入到 Llama 模型或由其生成的潜在问题内容,包括与犯罪活动、儿童剥削、版权侵犯、仇恨言论、自残和性虐待相关的内容。尽管如此,它显然不是万能药,因为Meta 自己的先前指南曾允许聊天机器人与未成年人进行感性或浪漫的对话,一些报道显示这些对话演变成了色情对话。开发人员可以自定义被阻止内容的类别,并将这些阻止应用于 Llama 支持的所有语言。

与 Llama Guard 类似,Prompt Guard 可以阻止发送给 Llama 的文本,但仅限于旨在“攻击”模型并使其产生不良行为的文本。Meta 声称 Llama Guard 可以防御明确恶意的提示(即试图绕过 Llama 内置安全过滤器的“越狱”提示),以及包含“注入输入”的提示。Llama Firewall 用于检测和防止诸如提示注入、不安全代码和有风险的工具交互等风险。Code Shield 则帮助减轻不安全代码建议,并为七种编程语言提供安全的命令执行。

至于 CyberSecEval,它与其说是一个工具,不如说是一系列用于衡量模型安全性的基准。CyberSecEval 可以根据 Meta 的标准评估 Llama 模型对应用程序开发人员和最终用户构成的风险,涉及“自动化社会工程”和“扩大攻击性网络操作”等领域。

Llama 的局限性

与所有生成式 AI 模型一样,Llama 也有一定的风险和局限性。例如,尽管其最新模型具有多模态功能,但这些功能目前主要仅限于英语。

从更宏观的角度看,Meta 使用了一批盗版电子书和文章的数据集来训练其 Llama 模型。一位联邦法官最近在 13 位作者提起的版权诉讼中支持了 Meta,裁定使用受版权保护的作品进行训练属于“合理使用”。然而,如果 Llama“复述”了受版权保护的片段,并且有人将该片段用于产品中,那么该用户可能会侵犯版权并承担责任。

Meta 还因对其 AI 使用 Instagram 和 Facebook 的帖子、照片和标题进行训练而受到争议,并且让用户难以选择退出

编程是使用 Llama 时需要谨慎对待的另一个领域。这是因为 Llama 可能会——也许比其他生成式 AI 同行更甚——产生错误或不安全的代码。在 LiveCodeBench(一项测试 AI 模型在竞争性编程问题上表现的基准测试)上,Meta 的 Llama 4 Maverick 模型得分为 40%。相比之下,OpenAI 的 GPT-5 High 得分为 85%,xAI 的 Grok 4 Fast 得分为 83%。

一如既往,最好由人类专家在将任何 AI 生成的代码纳入服务或软件之前进行审查。

最后,与其他 AI 模型一样,Llama 模型仍然会生成听起来合理但实际上是错误或误导性的信息,无论是在编码、法律指导还是与 AI 人物的情感对话中。

本文最初发布于 2024 年 9 月 8 日,并定期更新新信息。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型:https://api.qingyuntop.top/pricing

详细的调用教程及文档:https://api.qingyuntop.top/about

0

评论区