📢 转载信息
原文链接:https://blogs.nvidia.com/blog/dell-technologies-agent-enterprise-ai/
原文作者:NVIDIA Writers
借助 NVIDIA Vera Rubin NVL72,代理智能(Agentic AI)推理的单位代币成本降低至十分之一。在 NVIDIA Vera CPU 上运行的智能体沙盒速度比传统 CPU 快 50%,而企业数据查询速度则提升了 3 倍。目前,礼来(Lilly)、三星和霍尼韦尔(Honeywell)等 5000 多家企业正在利用配备 NVIDIA 的戴尔 AI 工厂运行 AI 工作负载,将宏伟目标转化为规模化的生产力。
这是戴尔董事长兼首席执行官迈克尔·戴尔(Michael Dell)在戴尔科技大会上描绘的图景。戴尔评估了市场潜力:到 2030 年,全球 AI 基础设施支出可能达到 3-4 万亿美元,同期代币消耗量预计将增长 3400%。
“一场大规模的 AI 投资热潮已经开启,生产力提升浪潮也随之而来,包括我们公司在内。”戴尔说道,“变革的速度呈抛物线式增长,且丝毫不减。”
随后,戴尔邀请 NVIDIA 创始人兼 CEO 黄仁勋登上舞台,展示了身后庞大的 NVIDIA 产品组合,从配备 GB10 的戴尔 Pro Max 工作站,到配备 NVIDIA Vera Rubin NVL72 的戴尔 PowerRack。
“我们已经进入了‘实用 AI’时代,这就是需求呈‘抛物线式’飙升的原因,完全是抛物线式的。”黄仁勋说,“过去需要几个月的工作,现在只需几周;过去需要几周的,现在只需几天;过去需要几天完成的,现在只需几小时。这对生产力而言意义重大,但对计算需求而言则是巨大的飞跃。”
代理时代的全新 AI 工厂
加速计算领域的最新动态成为本次升级的核心:基于 NVIDIA Vera Rubin NVL72 构建的戴尔 PowerEdge XE9812,其单位代币推理成本比 NVIDIA Blackwell 低 10 倍,适用于大规模代理 AI 推理。
与此同时,PowerEdge XE9880L、XE9885L 和 XE9882L 服务器也同步发布。这是首批基于 NVIDIA HGX Rubin NVL8 构建的戴尔系统,每个机架最高支持 144 个 GPU,采用 100% 直接液体冷却计算节点,性能是 HGX B200 的 10 倍。
在 CPU 方面,戴尔 PowerEdge M9822 和 R9822 服务器将 NVIDIA Vera CPU 引入了企业 AI 工厂。Vera 专为代理 AI 打造,运行数据管道、分析工具和代码工作负载。凭借 1.2 TB/s 的内存带宽,Vera 完成代理工作负载的速度比 x86 处理器快 50%。
在本地运行代理与模型——安全是关键
戴尔的调研显示,67% 的 AI 工作负载目前在云外运行(即本地、设备端或边缘),88% 的受访者至少在本地运行了一个 AI 工作负载。
为了回答“如何安全且合规地部署世界顶尖 AI 模型”这一核心问题,NVIDIA 提供了 NVIDIA 机密计算(Confidential Computing),联合 Fortanix、Google、Red Hat 等合作伙伴,为企业在内部安全部署前沿模型提供了基础,无需暴露模型 IP 或核心数据。
代理从桌面端走向数据中心
最贴近用户的发布是“戴尔桌面代理智能(Dell Deskside Agentic AI)”,它基于 NVIDIA NeMoClaw 栈、NVIDIA OpenShell 运行时和 NVIDIA Nemotron 开源模型,运行在配备 Grace Blackwell 架构的戴尔 Pro Max 系统上。
黄仁勋在台上形容 NVIDIA NeMoClaw 是连接本地模型与企业数据的“桥梁”,为构建企业级自主智能体提供了基础。而 NVIDIA OpenShell 作为一个开源运行时,支持全栈企业级 AI 部署,确保 AI 代理在从工作站到服务器的整个路径中均受到安全策略的管控。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区