📢 转载信息
原文链接:https://blogs.nvidia.com/blog/accelerated-scientific-systems/
原文作者:Dion Harris
过去,计算能力通常是从庞大的超级计算机向下渗透到我们口袋里的芯片。
在过去的15年里,创新的方向发生了改变:源于游戏并借助加速计算得到规模化的GPU,已经向上游猛冲,重新塑造了超级计算,并将AI革命带到了科学计算中最尖端的系统中。
位于于利希研究中心的JUPITER系统就是这个新时代的象征。
它不仅是最高效的超级计算机之一——每瓦特能产生633亿次浮点运算(gigaflops)的性能——它也是一个AI强力引擎,提供了116 AI Exaflops(前身为2025年ISC高性能大会上的92 Exaflops)。
这就是正在发生的“反转”。在2019年,近70%的TOP100高性能计算系统仅使用CPU。如今,这一比例已骤降至不足15%,其中88个TOP100系统是加速的——而且其中80%由NVIDIA GPU提供动力。
在更广泛的TOP500中,388个系统(占78%)现在使用NVIDIA技术,其中包括218个GPU加速系统(比去年同期增加了34个系统)以及362个由高性能NVIDIA网络连接的系统。这一趋势是明确的:加速计算已成为标准。
但真正的革命在于AI性能。借助NVIDIA Hopper和Blackwell等架构以及JUPITER等系统,研究人员现在可以获得比以往多出几个数量级的AI计算能力。
AI FLOPS已成为新的衡量标准,它正在气候建模、药物发现和量子模拟等领域催生突破——这些问题需要规模和效率的结合。
早在多年前,在今天的生成式AI浪潮出现之前,NVIDIA创始人兼首席执行官黄仁勋就在SC16大会上预见了未来。他预测AI很快将重塑全球最强大的计算系统。
“几年前,深度学习像雷神之锤从天而降,给了我们一个极其强大的工具来解决世界上一些最棘手的问题,”黄仁勋当时宣称。
计算功耗背后的数学原理早已决定了向GPU的转变是不可避免的。
但点燃AI革命的,是建立在这些GPU之上的NVIDIA CUDA-X计算平台,它极大地扩展了这些机器的能力。
突然之间,超级计算机不仅能在双精度(FP64)下提供有意义的科学成果,还能在混合精度(FP32, FP16)甚至超高效格式如INT8及更低精度下进行计算——这正是现代AI的支柱。
这种灵活性使研究人员能够以前所未有的方式扩展其功耗预算,以运行更大、更复杂的模拟和训练更深的神经网络,同时最大化每瓦性能。
但在AI普及之前,原始数据就已经迫使了这一转变。功耗预算是不可协商的。NVIDIA内部和整个社区的超级计算机研究人员都在努力应对未来的挑战,而这条道路上铺满了GPU。
为了在不产生一个胡佛大坝大小的电费账单的情况下达到Exascale(百亿亿次浮点运算),研究人员需要加速。GPU提供的每瓦特运算次数远超CPU。这是AI热潮来临之前的预兆,这也是为什么当AI热潮袭来时,大规模GPU系统已经具备了发展势头。
种子早在2012年就在橡树岭国家实验室的Titan系统中播下,它是美国首批大规模将CPU与GPU相结合的系统之一——展示了分层并行如何能释放巨大的应用增益。
2013年在欧洲,Piz Daint系统为性能和效率树立了新标杆,随后在关键领域证明了其实力:如用于天气预报的COSMO预测等实际应用。
到了2017年,拐点变得不可否认。橡树岭国家实验室的Summit和劳伦斯利弗莫尔国家实验室的Sierra为领导级系统设定了新标准:加速优先。它们不仅运行得更快;它们改变了科学界可以针对气候建模、基因组学、材料等领域提出的问题。
这些系统能够以更少的资源做更多的事情。在Green500最高效系统列表中,前八名都是NVIDIA加速的系统,其中7个使用NVIDIA Quantum InfiniBand进行连接。
但这些头条数字背后的故事是AI能力如何成为新的衡量标准:JUPITER在提供1 EF FP64的同时,还提供了116 AI Exaflops——这清晰地表明了科学现在如何将模拟和AI融为一体。
功耗效率不仅使Exascale成为可能;它使AI在Exascale级别上变得实用。一旦科学获得了大规模的AI能力,发展的曲线就急剧向上弯曲。
接下来的意义
这不仅仅是关于基准测试。这是关于真正的科学进步:
- 更快、更准确的天气和气候模型
- 在药物发现和基因组学方面取得突破
- 对聚变反应堆和量子系统的模拟
- 在每个学科中,由AI驱动的研究开启新前沿
这场转变始于对功耗效率的迫切需求,演变为架构优势,现已成熟为一种科学超级力量:模拟和AI以前所未有的规模结合在一起。
它始于科学计算。现在,计算领域的其他部分将跟进。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区