目 录CONTENT

文章目录

英伟达将在未来五年投入260亿美元开发开源AI模型

Administrator
2026-03-12 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.wired.com/story/nvidia-investing-26-billion-open-source-models/

原文作者:Will Knight


根据一份2025年的财务备案文件显示,英伟达将在未来五年内投入260亿美元用于构建开源(open source)人工智能模型。英伟达高管在接受WIRED采访时证实了这一此前未曾报道的消息。

这项巨额投资可能会使英伟达从一个拥有强大软件栈的芯片制造商,转变为一个名副其实的前沿实验室(frontier lab),有能力与OpenAI和DeepSeek等公司竞争。这是一个战略举措,因为它能进一步巩固英伟达作为AI领域领先芯片制造商的地位,因为这些模型是为公司的硬件量身定制的。

开源模型是指那些决定模型行为的权重或参数被公开发布的模型——有时还会包括其架构和训练的细节。这使得任何人都可以下载并在自己的机器或云端运行它们。在英伟达的案例中,该公司还公开了构建和训练其模型所涉及的技术创新,从而使初创公司和研究人员更容易修改和在此基础上进行构建。

周三,英伟达还发布了Nemotron 3 Super,这是其迄今为止能力最强的开源权重AI模型。该新模型的参数为1280亿(衡量模型规模和复杂性的指标),使其大致相当于最大版本的OpenAI的GPT-OSS,尽管该公司声称它在多项基准测试中优于GPT-OSS和其他模型。

具体而言,英伟达声称Nemotron 3 Super在人工智能指数(Artificial Intelligence Index)上获得了37分,该指数根据10项不同的基准测试对模型进行评分。GPT-OSS得分为33分——但几款中国模型得分更高。英伟达表示,Nemotron 3 Super在PinchBench上进行了秘密测试,该基准测试评估模型控制OpenClaw的能力,并在该测试中排名第一。

英伟达还介绍了用于训练Nemotron 3的一些技术诀窍。这些包括改进模型推理能力、长上下文处理能力以及对强化学习响应能力的架构和训练技术。

英伟达应用深度学习研究副总裁Bryan Catanzaro说:“英伟达正以更认真的态度对待开源模型开发。而且我们正在取得很多进展。”

开源前沿

Meta是第一家发布开源模型的大型AI公司,其Llama模型于2023年发布。然而,首席执行官马克·扎克伯格最近重启了公司的AI工作,并暗示未来可能不会完全开源其模型。OpenAI也提供了一个名为GPT-oss的开源权重模型,但它不如该公司最好的专有产品强大,也不太适合进行修改。

来自OpenAI、Anthropic和Google等公司提供的顶级美国模型,只能通过云端或聊天界面访问。相比之下,DeepSeek、阿里巴巴、Moonshot AI、Z.ai和MiniMax等中国公司的许多顶级模型的权重都是公开免费发布的。因此,世界各地许多初创公司和研究人员目前都在基于中国模型进行构建。

Catanzaro于2011年加入英伟达,并帮助推动公司从制造游戏图形卡转向制造AI芯片。他表示:“帮助生态系统发展符合我们的利益。”英伟达于2023年11月发布了第一个Nemotron模型。他补充说,英伟达最近完成了对一个5500亿参数模型的预训练。(预训练涉及将海量数据输入到分布在大量并行运行的专业芯片上的模型中。)此后,英伟达发布了一系列专为机器人、气候建模和蛋白质折叠等领域设计的模型。

企业生成式AI软件副总裁Kari Briski表示,英伟达未来的AI模型不仅有助于改进其芯片,还将有助于改进其构建的超级计算机规模的数据中心。“我们构建它是为了拉伸我们的系统,不仅测试计算能力,还测试存储和网络,并构建我们的硬件架构路线图,”她说。

公开发布模型也可能为英伟达带来长期的战略利益。该公司的芯片仍然是训练大型AI模型的黄金标准,客户花费数十亿美元购买公司的硬件用于其数据中心。但是,如果中国开源模型在竞争对手的硬件上展现出显著的改进,这些模型的崛起可能会侵蚀英伟达的地位。

2025年1月,DeepSeek发布了一个前沿的开源模型,采用了一种更有效的方法,使其训练成本大大降低。但来自阿里巴巴等大公司以及Moonshot AI、Z.ai和MiniMax等初创公司的各种其他中国模型,在西方也变得流行起来。阿里巴巴的Qwen模型因易于使用、易于修改且维护良好,被研究人员和初创公司广泛使用

据广泛传闻,DeepSeek即将发布的新模型是专门使用中国公司华为制造的芯片训练的,该公司受到美国政府的制裁。如果属实,此次发布可能会促使更多初创公司和研究人员尝试使用华为的硬件,尤其是在中国。

从这个角度来看,英伟达可能通过提供美国制造的替代品来抗衡中国开源权重模型,从而帮助塑造美国和中国之间的AI竞争格局。

Catanzaro说:“我们是一家美国公司,但我们与世界各地的公司合作。让生态系统在任何地方都多元化和强大,符合我们的利益。”

一些行业专家警告说,看到开源创新转向世界的另一边,从长远来看可能对美国不利。

艾伦人工智能研究所(Ai2)的AI研究员Nathan Lambert是ATOM(美国真正开源模型)项目的负责人。他说:“我非常看好Nemotron。”Lambert补充说,美国政府也应该资助开源模型。

专注于促进AI开放性的非营利组织Laude研究所的计算机科学家兼企业家Andy Konwinski表示,英伟达的投资非常重要,因为它处于AI研究的交汇点。“他们处于许多开源和闭源AI努力的最前沿,”Konwinski说。“这是他们对开放性信念的空前信号。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区