📢 转载信息
原文链接:https://www.wired.com/story/nvidia-becomes-major-model-maker-nemotron-3/
原文作者:Will Knight
英伟达(Nvidia)通过为从事人工智能(artificial intelligence)的公司提供芯片赚取了巨额财富,但今天,这家芯片制造商通过发布一系列尖端的开源模型、以及帮助工程师使用的配套数据和工具,向成为更严肃的模型开发者迈出了一步。
此举正值OpenAI、谷歌和Anthropic等人工智能公司开发自己日益强大的芯片之际,此举可能旨在对冲这些公司随着时间的推移而偏离英伟达技术的风险。
开源模型已经是AI生态系统中至关重要的一部分,许多研究人员和初创公司利用它们进行实验、原型设计和构建。虽然OpenAI和谷歌提供小型开源模型,但它们更新的频率不如中国的竞争对手。根据开源项目托管平台Hugging Face的数据,由于这些原因以及其他原因,来自中国公司的开源模型目前更为流行。
据该公司在发布前分享的基准分数显示,英伟达全新的Nemotron 3模型是可下载、修改并在用户自有硬件上运行的最佳模型之一。
首席执行官黄仁勋(Jensen Huang)在消息发布前的一份声明中表示:“开放式创新是AI进步的基础。通过Nemotron,我们将先进的人工智能转变为一个开放的平台,为开发人员提供大规模构建代理系统所需的透明度和效率。”
英伟达采取了比许多美国竞争对手更为完全透明的方法,发布了训练Nemotron所使用的数据——这一事实应有助于工程师更轻松地修改模型。该公司还发布了有助于定制和微调的工具。其中包括一种新的混合专家专家模型(hybrid latent mixture-of-experts)架构,英伟达表示这种架构特别适合构建可以在计算机或网络上执行操作的AI代理。该公司还推出了允许用户通过强化学习(reinforcement learning)训练代理执行任务的库,强化学习涉及向模型提供模拟的奖励和惩罚。
Nemotron 3模型有三种尺寸:Nano(具有300亿参数)、Super(具有1000亿参数)和Ultra(具有5000亿参数)。模型的参数大致对应于其能力以及运行它的复杂程度。最大的模型非常庞大,需要在昂贵硬件机架上运行。
模型基础
英伟达企业生成式AI软件副总裁Kari Ann Briski表示,开源模型对AI构建者很重要有三个原因:构建者越来越需要在特定任务上定制模型;将查询分派给不同模型通常很有帮助;以及通过让模型执行一种模拟推理,可以在训练后从中挤出更智能的响应。Briski说:“我们相信开源是人工智能创新的基础,将继续加速全球经济发展。”
社交媒体巨头Meta于2023年2月发布了第一个先进的开源模型,名为Llama。然而,随着竞争的加剧,Meta已暗示其未来的发布可能不会是开源的。
此举是人工智能行业一个更大趋势的一部分。在过去一年中,美国公司正越来越多地转向不那么开放,对其研究变得更加保密,并更不愿向竞争对手透露其最新的工程技巧。
OpenRouter(一家通过单一用户界面为人们提供访问不同模型服务的公司)最近的一份报告显示,2025年通过其系统传输的所有Token(文本和其他数据单位)中,大约有三分之一由开源模型贡献。包括DeepSeek、阿里巴巴、月之暗面(Moonshot AI)、智谱AI(Z.ai)和MiniMax在内的中国公司定期发布强大的开源模型,并公布其研究进展细节,这使得它们的模型对工程师的实验更具吸引力。
这可能对英伟达构成麻烦。该公司的硬件在人工智能领域变得如此重要,以至于其芯片已成为特朗普对华贸易谈判中的筹码。美国政府最近表示将允许英伟达向中国出口H200芯片——其上一代最好的芯片——但中国政府热衷于实现更大的技术独立,并已采取措施推动中国公司使用国产芯片。这可能意味着中国的人工智能模型将与中国芯片更加紧密地结合,从而可能削弱英伟达的地位。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区