目 录CONTENT

文章目录

GTC聚焦NVIDIA RTX PC和DGX Spark本地运行最新开源模型及AI代理

Administrator
2026-03-18 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://blogs.nvidia.com/blog/rtx-ai-garage-gtc-2026-nemoclaw/

原文作者:Gerardo Delgado


个人计算的范式一直围绕着个人设备的概念——从PC到智能手机和平板电脑。如今,生成式AI——尤其是OpenClaw——引入了一个新类别:代理计算机。这些设备,如NVIDIA DGX Spark桌面AI超级计算机或专用的NVIDIA RTX PC,非常适合运行个人代理——私密且免费。

NVIDIA GTC本周正在进行中,展示了一系列关于代理AI的公告,包括:

  • 用于本地代理的新开源模型,包括NVIDIA Nemotron 3 Nano 4B和Nemotron 3 Super 120B,以及对Qwen 3.5和Mistral Small 4的优化。
  • NVIDIA NemoClaw,一个用于OpenClaw的开源栈,通过提高安全性和支持本地模型来优化NVIDIA设备上的OpenClaw体验。
  • 使用Unsloth Studio可以更轻松地进行微调,以进一步提高代理工作流的开放模型准确性。

亲临GTC现场的参会者可以前往GTC Park的NVIDIA build-a-claw活动,活动时间为3月19日每天的上午8点至下午5点。NVIDIA专家将帮助访客使用他们选择的设备定制和部署一个主动的、始终在线的AI助手。无论是技术爱好者还是仅仅感到好奇,参与者都将为其代理命名,定义其个性,并授予其访问所需工具的权限——创建一个可以从他们喜欢的消息应用程序访问的个人助手。

新开源模型将云端级质量带入本地代理

下一代本地模型——具有越来越大的上下文窗口——提供了在PC上运行代理的智能。结合更丰富的用户上下文和强大的本地工具,这些进步正在为AI PC带来新的可能性,特别是在DGX Spark上,其128GB的统一内存支持超过1200亿参数的模型。

Nemotron 3 Super,上周发布,是一个拥有1200亿参数的开源模型,其中120亿参数是激活的,旨在运行复杂的代理AI系统。Nemotron 3 Super最适合为DGX Spark或NVIDIA RTX PRO工作站上的代理提供支持。在PinchBench——一个用于确定大型语言模型在OpenClaw上性能的新基准测试中,Nemotron 3 Super得分85.6%,成为同类产品中最佳的开源模型。

Mistral Small 4,一个拥有1190亿参数(激活参数60亿,包含所有层为80亿)的开源模型,统一了Mistral旗舰模型的功能。用户现在拥有一个为通用聊天、编码和代理任务优化的超高效模型。

这两个模型都可以在DGX Spark和RTX PRO GPU上本地运行。

对于寻求更小模型的GeForce RTX用户,Nemotron 3 Nano 4B是最新加入NVIDIA Nemotron 3开源模型系列的模型,为在RTX AI PC上本地构建代理和助手提供了一个紧凑而强大的起点。该模型非常适合在资源受限的硬件上运行的游戏和应用程序中构建能够执行操作的对话式角色。它适用于任何支持NVIDIA GPU的系统,并结合了最先进的指令遵循能力和出色的工具使用能力,同时显存占用极小。

此外,NVIDIA还宣布了对阿里巴巴的Qwen 3.5模型的优化,这些模型已经展示了出色的准确性(27B9B4B),并适用于在NVIDIA GPU上运行本地代理。新模型原生支持视觉、多标记预测和一个高达262,000个标记的上下文窗口。270亿参数的密集模型与RTX 5090 GPU配对时表现出色。

所有配置均使用NVIDIA RTX 5090和Mac M3 Ultra台式机上的Q4_K_M量化BS = 1, ISL = 1024和OSL = 128进行测量。令牌生成吞吐量在llama.cpp b7789上使用llama-bench工具测量。

用户可以通过Ollama、LM Studio和llama.cpp立即尝试这些模型,推理速度得益于RTX GPU和DGX Spark的加速。请访问NVIDIA开源模型了解更多最新信息。

使用最新RTX优化模型加速创意AI

LTX 2.3,Lightricks最先进的音频视频模型,本月早些时候发布,现已支持NVFP4FP8蒸馏模型,性能提升2.1倍。有关Lightricks的LTX 2.3模型的更多信息。

此外,Black Forest Lab的FLUX.2 Klein 9B在上周进行了更新,将图像编辑速度提升了高达2倍。NVIDIA已与Black Forest Labs合作发布了FP8版本,该版本针对RTX GPU进行了优化,以实现最快的性能和最佳的显存占用。

NVIDIA NemoClaw — NVIDIA对OpenClaw的优化

AI开发者和爱好者正在购买DGX Spark超级计算机或构建专用的RTX PC来运行自主AI代理,例如OpenClaw,这些代理可以从个人文件、应用程序和工作流程中提取上下文并自动化日常任务。然而,随着OpenClaw等代理系统的采用率不断增长,人们对其代币成本以及安全性和隐私的担忧也在增加。

为了帮助解决这些担忧,NVIDIA本周推出了NemoClaw,这是一个用于OpenClaw的开源栈,可在NVIDIA设备上部署OpenClaw的优化。NemoClaw中的首批功能包括NVIDIA Nemotron开源模型和NVIDIA OpenShell运行时。Nemotron本地模型使用户能够本地运行推理,这意味着更好的隐私和零代币成本。OpenShell是为更安全地执行claws而设计的运行时。

请了解有关NemoClaw的更多信息。观看NVIDIA创始人兼首席执行官黄仁勋的GTC主题演讲,并浏览会议内容

使用Unsloth Studio轻松微调

随着开源模型取得巨大飞跃,进一步提高准确性的一种方法是微调,这允许用户为自己的数据和用例定制模型。这一过程通常需要深入的技术专业知识、编码知识和大量的配置。Unsloth,一个领先的模型微调和对齐开源库,今天推出了Unsloth Studio,这是一个易于使用的、基于Web的用户界面,简化了AI爱好者和开发者的微调过程。

Unsloth Studio支持超过500个AI模型。简单的用户界面使得训练和微调过程变得容易:用户只需上传他们的数据集,点击基于图形的画布生成额外的、高质量的合成数据,然后启动微调任务。它支持量化低秩自适应(QLoRA)、低秩自适应(LoRA)和全模型微调。在模型微调过程中,用户可以监控和可视化任务进度。最后,他们可以在同一个Web应用程序内将模型导出到选择的框架并开始聊天。

Unsloth Studio的新界面建立在Unsloth库之上,该库使用自定义的专用GPU内核,训练速度提高了2倍,显存节省高达70%。这意味着新用户可以开箱即用地充分利用他们的NVIDIA RTX GPU和DGX Spark。

立即试用Unsloth Studio,包括Nemotron 3 Nano 4B和Qwen 3.5等新模型。请查看其他RTX AI Garage帖子,了解更多关于使用NVIDIA GeForce RTX GPU微调模型的信息。

GTC 2026回顾 (#ICYMI)

RTX AI视频生成指南,包含ComfyUI中的RTX视频:今年早些时候在CES上发布的全新RTX AI视频生成指南,向创作者和爱好者展示了如何使用引导式文本到图像工作流从概念到创作,生成AI生成视频的关键帧,然后使用本地GPU上运行的RTX视频技术将其提升至4K。通过该指南开始创作,并在社交媒体上使用#AIonRTX分享您的作品。

💿NVIDIA AI for Media是一套高性能、易于使用的软件开发工具包,可将NVIDIA Broadcast级别的AI效果——增强音频(LinuxWindows)、视频增强现实功能——集成到实时媒体、视频会议和后期制作工作流程中。最新的更新(今天可用)增加了更准确的唇同步、多发言者检测、通过RTX Video Super Resolution功能在RTX PRO以及GeForce RTX 40和50系列GPU上实现更快的4K升级、更好的背景噪音抑制以及NVIDIA Studio Voice功能的更低延迟。

💻NVIDIA DLSS 5将于今年秋季推出,它通过注入照片级光照和材质来为游戏带来视觉保真度的AI驱动突破,从而弥合渲染与现实之间的差距。

🤖Maxon发布了Redshift 2026.4,引入了由DLSS驱动的全新实时可视化工作流程,使建筑师能够以交互式的速度和质量浏览项目。“NVIDIA的DLSS技术是关键组成部分,使我们能够以交互式速度交付高质量的视觉效果,”Maxon首席技术和AI官Philip Losch表示。

🪟Reincubate Camo在其Camo Streamlight应用程序中增加了Windows ML on NVIDIA TensorRT RTX EP,用于AI Autotune,显著提升了在RTX GPU上的性能。

FacebookInstagramTikTokX上连接到NVIDIA AI PC——并通过订阅RTX AI PC新闻通讯了解最新信息。

关注NVIDIA Workstation的LinkedInX

请参阅有关软件产品信息的声明




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区