英伟达 GB300 NVL72 刷新 MLPerf 纪录：10 分钟训完 4050 亿 AI 参数模型-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

英伟达 GB300 NVL72 刷新 MLPerf 纪录：10 分钟训完 4050 亿 AI 参数模型

Administrator

2025-11-13 / 0 评论 / 0 点赞 / 1 阅读 / 0 字

11/13

📢 转载信息

原文链接：https://www.ithome.com/0/897/091.htm

原文作者：故渊

IT之家 11 月 13 日消息，科技媒体 Wccftech 昨日（11 月 12 日）发布博文，报道称在 MLPerf AI 训练基准测试中，英伟达基于 Blackwell Ultra 架构的 GB300 NVL72 平台包揽了全部 7 个项目的冠军，取得了压倒性胜利。

IT之家援引博文介绍，本次测试中最亮眼的成绩是，GB300 NVL72 平台仅用时 10 分钟，便完成训练拥有 4050 亿参数的 Llama 3.1 大模型。

此外，在其他关键测试中也表现出色，例如仅需 0.4 分钟即可完成 Llama 2 70B 模型的 LoRA 微调，训练 Llama 3.1 8B 模型也只需 5.2 分钟。

与上一代产品相比，Blackwell Ultra 的性能实现了巨大飞跃。测试结果显示，在 Llama 2 70B 微调任务中，8 块 GB300 GPU 提供的性能是同等数量 H100 GPU 的 5 倍。

而在 Llama 3.1 405B 预训练任务中，GB300 的性能也达到了 H100 的 4 倍以上，并且比同为 Blackwell 架构的 GB200 快了近 2 倍。

该媒体指出这一性能突破的背后，是软硬件协同创新的结果。硬件方面，GB300 NVL72 系统集成了速率高达 800 GB/s 的 Quantum-X800 InfiniBand 高速网络，并为每块 GPU 配备了 279GB 的 HBM3e 高带宽内存，整个系统的总内存容量（GPU+CPU）更是达到了惊人的 40TB。

在软件层面，FP4 精度的全面采用是关键。英伟达通过在模型训练的每一层都应用 FP4 精度，将计算速度提升至 FP8 的两倍，而 Blackwell Ultra 架构则将这一优势进一步放大至 3 倍。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

英伟达 GB300 NVL72 刷新 MLPerf 纪录：10 分钟训完 4050 亿 AI 参数模型

评论区