目 录CONTENT

文章目录

NVIDIA DGX Spark和DGX Station助力桌面端最新的开源和前沿模型

Administrator
2026-01-06 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://blogs.nvidia.com/blog/dgx-spark-and-station-open-source-frontier-models/

原文作者:Chris Marriott


开源AI正在加速各行业的创新,而 NVIDIA DGX SparkDGX Station 正是为帮助开发者将创新转化为实际影响而构建的。

今天,NVIDIA在CES贸易展上宣布,DGX Spark和DGX Station桌面级AI超级计算机让开发者能够在本地桌面系统上利用最新的开源和前沿AI模型,DGX Spark支持百亿参数模型,而DGX Station支持万亿参数模型。

这些系统由NVIDIA Grace Blackwell架构驱动,拥有大的统一内存和Petaflop级别的AI性能,赋予开发者本地开发和轻松扩展到云端的新能力。

提升所有开源AI模型的性能

得益于模型优化和与开源社区的持续合作,以前通常需要数据中心才能运行的各种高度优化的开源模型,现在可以在DGX Spark和DGX Station上进行桌面加速。

DGX Spark预先配置了NVIDIA AI软件和NVIDIA CUDA-X库,为开发者、研究人员和数据科学家提供即插即用的强大优化能力,用于构建、微调和运行AI。

Spark为所有开发者在桌面运行最新AI模型奠定了基础;而Station则使企业和研究实验室能够运行更先进、大规模的前沿AI模型。这些系统支持直接在桌面上运行最新的框架和开源模型——包括最近发布的NVIDIA Nemotron 3模型

驱动DGX Spark的NVIDIA Blackwell架构包含了NVFP4数据格式,该格式可将AI模型压缩高达70%,并在不损失智能的情况下提升性能。

NVIDIA与开源软件生态系统的合作,例如与llama.cpp的合作,正在进一步推动性能提升,在DGX Spark上运行最先进的AI模型时,平均性能提升了35%。Llama.cpp还包含一个“生活质量”的升级,缩短了LLM的加载时间。

DGX Station配备了GB300 Grace Blackwell Ultra超级芯片和775GB的FP4精度一致性内存,可以运行高达1万亿参数的模型——为前沿AI实验室提供了从桌面运行大规模模型的尖端计算能力。这包括各种先进的AI模型,如Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick、Qwen3和OpenAI gpt-oss-120b。

vLLM的核心维护者Kaichao You表示:“NVIDIA GB300通常以机架规模系统进行部署。这使得vLLM等项目难以直接在强大的GB300超级芯片上进行测试和开发。DGX Station改变了这种动态。通过以紧凑的单系统桌面形态提供GB300,DGX Station使vLLM能够以显著降低的成本测试和开发特定于GB300的功能。这加速了开发周期,并使vLLM能够持续针对GB300进行验证和优化。”

SGLang社区贡献者Jerry Zhou表示:“DGX Station将数据中心级的GPU能力直接带入了我的房间。它足够强大,可以在本地为Qwen3-235B等非常大的模型提供服务,使用大型模型配置测试训练框架,并开发具有超大矩阵尺寸的CUDA内核,所有这些都不再依赖于云机架。这极大地缩短了系统和框架开发的迭代周期。”

NVIDIA将在CES上现场展示DGX Station的能力,演示内容包括:

  • 以惊人的每秒25万个token的速度进行LLM预训练。
  • 对数百万个数据点进行类别聚类的海量数据可视化。主题建模工作流使用了NVIDIA cuML库加速的机器学习技术和算法。
  • 使用Text to Knowledge GraphLlama 3.3 Nemotron Super 49B以高精度可视化海量知识数据库。

扩展AI和创作者工作流程

DGX Spark和Station专为支持完整的AI开发生命周期而设计,涵盖从原型设计和微调到推理和数据科学,适用于医疗、机器人、零售、创意工作流程等广泛的行业特定AI应用。

对于创作者而言,包括Black Forest Labs的FLUX.2和FLUX.1,以及阿里的Qwen-Image在内的最新扩散和视频生成模型,现已支持NVFP4,从而减少了内存占用并加快了性能。新的Lightricks LTX-2视频模型现已可供下载,包括适用于NVIDIA GPU的NVFP8量化检查点,其质量与顶级云端模型不相上下。

CES的现场演示突出显示了DGX Spark如何能将苛刻的视频生成工作负载从创作者笔记本电脑上卸载,与配备M4 Max的顶级MacBook Pro相比,实现了8倍加速,从而使本地系统能够进行不间断的创意工作。

开源RTX Remix模组平台有望很快赋予3D艺术家和模组制作者使用DGX Spark进行更快的生成式AI创作能力。额外的CES演示展示了一个模组团队如何将所有资产创建工作卸载到DGX Spark上,从而解放他们的PC进行无停顿的模组制作,并使他们能够实时查看游戏内变化。

AI编程助手也在改变开发者的生产力。在CES上,NVIDIA展示了由DGX Spark上的NVIDIA Nsight驱动的本地CUDA编程助手,该助手允许开发者在保持源代码本地和安全的同时,受益于AI辅助的企业级开发。

行业领导者认可向本地AI的转变

随着对安全、高性能边缘AI的需求不断增长,DGX Spark正在整个行业中获得动力。

软件领导者、开源创新者和全球工作站合作伙伴正在采用DGX Spark来驱动本地推理、智能体工作流程和检索增强生成(RAG),而无需集中式基础设施的复杂性。

他们的观点强调了DGX Spark如何在桌面上实现更快的迭代、对数据和IP更大的控制权,以及新的、更具交互性的AI体验。

在CES上,NVIDIA演示了如何利用DGX Spark的处理能力与Hugging Face Reachy Mini机器人合作,将AI智能体带入现实世界。

Hugging Face产品副总裁Jeff Boudier表示:“开源模型赋予开发者以他们自己的方式构建AI的自由,而DGX Spark将这种能力直接带到了桌面上。当你将它与Reachy Mini连接起来时,你的本地AI智能体就具象化并拥有了自己的声音。它们可以看到你、听到你,并以富有表现力的动作回应——将强大的AI转变为你可以真正互动的对象。”

Hugging Face和NVIDIA发布了使用DGX Spark和Reachy Mini构建交互式AI智能体的分步指南

IBM数据与AI平台战略副总裁Ed Anuff表示:“DGX Spark将AI推理带到了边缘。通过Spark上的OpenRAG,用户可以获得一个完整、自包含的RAG堆栈:提取、嵌入、检索和推理。”

JetBrains首席执行官Kirill Skrygan表示:“对于需要完全控制安全性、治理和知识产权的组织来说,NVIDIA DGX Spark为JetBrains客户带来了Petaflop级的AI性能。无论客户偏爱云端、本地部署还是混合部署,JetBrains AI都旨在满足他们的需求。”

TRINITY是一款专为城市交通设计的智能、自平衡三轮单人载具,将在CES上展出,它使用DGX Spark作为AI推理的“大脑”,处理开源的实时视觉语言模型工作负载。

will.i.am表示:“TRINITY代表了微出行(micromobility)的未来——人类、车辆和AI智能体无缝协作。有了NVIDIA DGX Spark作为其AI大脑,TRINITY可以提供对话式、目标跟踪的工作流程,改变人们在连接城市中与出行互动的方式。它是装在轮子上的大脑,从智能体角度出发进行设计。”

加速AI开发者的采用

DGX Spark 方案手册(playbooks)帮助开发者快速启动现实世界的AI项目。在CES上,NVIDIA正在通过六个新的方案手册和四个主要更新来扩展此库,涵盖了最新的NVIDIA Nemotron 3 Nano模型、机器人训练、视觉语言模型、使用两个DGX Spark系统微调AI模型、基因组学和金融分析等主题。

随着DGX Station在今年晚些时候上市,将添加更多方案手册供开发者开始使用NVIDIA GB300系统。

NVIDIA AI Enterprise 软件支持现已适用于DGX Spark和制造商合作伙伴的GB10系统。NVIDIA AI Enterprise包含了用于AI应用程序开发和模型安装的库、框架和微服务,以及用于GPU优化的算子和驱动程序,支持快速可靠的AI工程和部署。许可证预计将在1月底前提供。

供货情况

DGX Spark和制造商合作伙伴的GB10系统可从AcerAmazonASUSDell TechnologiesGIGABYTEHP Inc.LenovoMicro CenterMSIPNY处购买。

DGX Station将于2026年春季开始从ASUS、Boxx、Dell Technologies、GIGABYTE、HP Inc.、MSI和Supermicro处供货。

深入了解DGX Spark,请参阅这篇技术博客

有关软件产品信息,请参阅声明




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区