NVIDIA DGX Spark和DGX Station助力桌面端最新的开源和前沿模型-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://blogs.nvidia.com/blog/dgx-spark-and-station-open-source-frontier-models/

原文作者：Chris Marriott

开源AI正在加速各行业的创新，而 NVIDIA DGX Spark 和 DGX Station 正是为帮助开发者将创新转化为实际影响而构建的。

今天，NVIDIA在CES贸易展上宣布，DGX Spark和DGX Station桌面级AI超级计算机让开发者能够在本地桌面系统上利用最新的开源和前沿AI模型，DGX Spark支持百亿参数模型，而DGX Station支持万亿参数模型。

这些系统由NVIDIA Grace Blackwell架构驱动，拥有大的统一内存和Petaflop级别的AI性能，赋予开发者本地开发和轻松扩展到云端的新能力。

提升所有开源AI模型的性能

得益于模型优化和与开源社区的持续合作，以前通常需要数据中心才能运行的各种高度优化的开源模型，现在可以在DGX Spark和DGX Station上进行桌面加速。

DGX Spark预先配置了NVIDIA AI软件和NVIDIA CUDA-X库，为开发者、研究人员和数据科学家提供即插即用的强大优化能力，用于构建、微调和运行AI。

Spark为所有开发者在桌面运行最新AI模型奠定了基础；而Station则使企业和研究实验室能够运行更先进、大规模的前沿AI模型。这些系统支持直接在桌面上运行最新的框架和开源模型——包括最近发布的NVIDIA Nemotron 3模型。

驱动DGX Spark的NVIDIA Blackwell架构包含了NVFP4数据格式，该格式可将AI模型压缩高达70%，并在不损失智能的情况下提升性能。

NVIDIA与开源软件生态系统的合作，例如与llama.cpp的合作，正在进一步推动性能提升，在DGX Spark上运行最先进的AI模型时，平均性能提升了35%。Llama.cpp还包含一个“生活质量”的升级，缩短了LLM的加载时间。

DGX Station配备了GB300 Grace Blackwell Ultra超级芯片和775GB的FP4精度一致性内存，可以运行高达1万亿参数的模型——为前沿AI实验室提供了从桌面运行大规模模型的尖端计算能力。这包括各种先进的AI模型，如Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick、Qwen3和OpenAI gpt-oss-120b。

vLLM的核心维护者Kaichao You表示：“NVIDIA GB300通常以机架规模系统进行部署。这使得vLLM等项目难以直接在强大的GB300超级芯片上进行测试和开发。DGX Station改变了这种动态。通过以紧凑的单系统桌面形态提供GB300，DGX Station使vLLM能够以显著降低的成本测试和开发特定于GB300的功能。这加速了开发周期，并使vLLM能够持续针对GB300进行验证和优化。”

SGLang社区贡献者Jerry Zhou表示：“DGX Station将数据中心级的GPU能力直接带入了我的房间。它足够强大，可以在本地为Qwen3-235B等非常大的模型提供服务，使用大型模型配置测试训练框架，并开发具有超大矩阵尺寸的CUDA内核，所有这些都不再依赖于云机架。这极大地缩短了系统和框架开发的迭代周期。”

NVIDIA将在CES上现场展示DGX Station的能力，演示内容包括：

以惊人的每秒25万个token的速度进行LLM预训练。
对数百万个数据点进行类别聚类的海量数据可视化。主题建模工作流使用了NVIDIA cuML库加速的机器学习技术和算法。
使用Text to Knowledge Graph和Llama 3.3 Nemotron Super 49B以高精度可视化海量知识数据库。

扩展AI和创作者工作流程

DGX Spark和Station专为支持完整的AI开发生命周期而设计，涵盖从原型设计和微调到推理和数据科学，适用于医疗、机器人、零售、创意工作流程等广泛的行业特定AI应用。

对于创作者而言，包括Black Forest Labs的FLUX.2和FLUX.1，以及阿里的Qwen-Image在内的最新扩散和视频生成模型，现已支持NVFP4，从而减少了内存占用并加快了性能。新的Lightricks LTX-2视频模型现已可供下载，包括适用于NVIDIA GPU的NVFP8量化检查点，其质量与顶级云端模型不相上下。

CES的现场演示突出显示了DGX Spark如何能将苛刻的视频生成工作负载从创作者笔记本电脑上卸载，与配备M4 Max的顶级MacBook Pro相比，实现了8倍加速，从而使本地系统能够进行不间断的创意工作。

开源RTX Remix模组平台有望很快赋予3D艺术家和模组制作者使用DGX Spark进行更快的生成式AI创作能力。额外的CES演示展示了一个模组团队如何将所有资产创建工作卸载到DGX Spark上，从而解放他们的PC进行无停顿的模组制作，并使他们能够实时查看游戏内变化。

AI编程助手也在改变开发者的生产力。在CES上，NVIDIA展示了由DGX Spark上的NVIDIA Nsight驱动的本地CUDA编程助手，该助手允许开发者在保持源代码本地和安全的同时，受益于AI辅助的企业级开发。

行业领导者认可向本地AI的转变

随着对安全、高性能边缘AI的需求不断增长，DGX Spark正在整个行业中获得动力。

软件领导者、开源创新者和全球工作站合作伙伴正在采用DGX Spark来驱动本地推理、智能体工作流程和检索增强生成（RAG），而无需集中式基础设施的复杂性。

他们的观点强调了DGX Spark如何在桌面上实现更快的迭代、对数据和IP更大的控制权，以及新的、更具交互性的AI体验。

在CES上，NVIDIA演示了如何利用DGX Spark的处理能力与Hugging Face Reachy Mini机器人合作，将AI智能体带入现实世界。

Hugging Face产品副总裁Jeff Boudier表示：“开源模型赋予开发者以他们自己的方式构建AI的自由，而DGX Spark将这种能力直接带到了桌面上。当你将它与Reachy Mini连接起来时，你的本地AI智能体就具象化并拥有了自己的声音。它们可以看到你、听到你，并以富有表现力的动作回应——将强大的AI转变为你可以真正互动的对象。”

Hugging Face和NVIDIA发布了使用DGX Spark和Reachy Mini构建交互式AI智能体的分步指南。

IBM数据与AI平台战略副总裁Ed Anuff表示：“DGX Spark将AI推理带到了边缘。通过Spark上的OpenRAG，用户可以获得一个完整、自包含的RAG堆栈：提取、嵌入、检索和推理。”

JetBrains首席执行官Kirill Skrygan表示：“对于需要完全控制安全性、治理和知识产权的组织来说，NVIDIA DGX Spark为JetBrains客户带来了Petaflop级的AI性能。无论客户偏爱云端、本地部署还是混合部署，JetBrains AI都旨在满足他们的需求。”

TRINITY是一款专为城市交通设计的智能、自平衡三轮单人载具，将在CES上展出，它使用DGX Spark作为AI推理的“大脑”，处理开源的实时视觉语言模型工作负载。

will.i.am表示：“TRINITY代表了微出行（micromobility）的未来——人类、车辆和AI智能体无缝协作。有了NVIDIA DGX Spark作为其AI大脑，TRINITY可以提供对话式、目标跟踪的工作流程，改变人们在连接城市中与出行互动的方式。它是装在轮子上的大脑，从智能体角度出发进行设计。”

加速AI开发者的采用

DGX Spark 方案手册（playbooks）帮助开发者快速启动现实世界的AI项目。在CES上，NVIDIA正在通过六个新的方案手册和四个主要更新来扩展此库，涵盖了最新的NVIDIA Nemotron 3 Nano模型、机器人训练、视觉语言模型、使用两个DGX Spark系统微调AI模型、基因组学和金融分析等主题。

随着DGX Station在今年晚些时候上市，将添加更多方案手册供开发者开始使用NVIDIA GB300系统。

NVIDIA AI Enterprise 软件支持现已适用于DGX Spark和制造商合作伙伴的GB10系统。NVIDIA AI Enterprise包含了用于AI应用程序开发和模型安装的库、框架和微服务，以及用于GPU优化的算子和驱动程序，支持快速可靠的AI工程和部署。许可证预计将在1月底前提供。

供货情况

DGX Spark和制造商合作伙伴的GB10系统可从Acer、Amazon、ASUS、Dell Technologies、GIGABYTE、HP Inc.、Lenovo、Micro Center、MSI和PNY处购买。

DGX Station将于2026年春季开始从ASUS、Boxx、Dell Technologies、GIGABYTE、HP Inc.、MSI和Supermicro处供货。

深入了解DGX Spark，请参阅这篇技术博客。

有关软件产品信息，请参阅声明。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

NVIDIA DGX Spark和DGX Station助力桌面端最新的开源和前沿模型

提升所有开源AI模型的性能

扩展AI和创作者工作流程

行业领导者认可向本地AI的转变

加速AI开发者的采用

供货情况

评论区