📢 转载信息
原文链接:https://blogs.nvidia.com/blog/power-flexible-ai-factories-energy-grid/
原文作者:Josh Parker (NVIDIA Blog)
在 2020 年欧洲杯足球赛英格兰对阵德国比赛的中场休息时,英国有数百万观众同时离开了电视机,去做同一件事——打开水壶烧水。
为英格兰和威尔士提供电力的国家电网(National Grid)监测到,短短几分钟内,这次全民“喝茶间歇”带来了约 1 吉瓦(GW)的用电峰值,这相当于一个标准核反应堆的平均输出功率。电网运营商必须谨慎管理这些高峰负荷以维持系统稳定,而随着电网接入更多的大型客户,这项工作变得愈发困难。
但如果这些新用户能够具备电力灵活性,并在电网负荷高峰期主动减压呢?
在最近发布的一份白皮书中,Emerald AI 与英伟达、EPRI、National Grid 以及 Nebius 合作,展示了“电力灵活”的 AI 工厂如何能在需求高峰期间自主调节功耗。对于 AI 工厂而言,这不仅能解锁更快的电网接入速度,无需等待数年之久的庞大基建升级,对于公众而言,它还能通过抑制系统需要满足的峰值负荷来限制电网扩建,从而帮助保持合理的电价。
烧开水与平衡电网
在亚利桑那州、弗吉尼亚州和伊利诺伊州的 AI 工厂完成成功的概念验证试验后,Emerald AI 于去年 12 月将这一灵活电网解决方案带到了伦敦。他们在 Nebius 的全新 AI 工厂中部署了 Emerald AI Conductor 平台,该工厂基于英伟达架构构建,是英国同类设施中的首批代表。
在该 AI 工厂中,研究团队运行了生产级 AI 工作负载,所用集群搭载了 96 个 NVIDIA Blackwell Ultra GPU,并通过 NVIDIA Quantum-X800 InfiniBand 平台实现互联。利用 NVIDIA 系统管理接口,系统能够实时获取秒级的 GPU 功耗遥测数据。
EPRI 和 National Grid 对电网进行了压力测试模拟——从雷击到风力发电供应不足等各种场景——并发出指令,借助 Conductor 平台引导 AI 工厂暂时降低用电量以缓解电网压力。其中一个场景就是模拟了“电视效应”(TV pickup),即复刻了那场欧洲杯足球赛引发的能源激增。
当数百万台模拟“电水壶”即将开启时,AI 集群主动降低了功耗,成功充当了电网突发负荷激增的“减震器”,且未中断集群中运行的最高优先级 AI 任务。
在实践中,这意味着电网可以更高效地利用现有容量来应对突发需求波动,从而减少为满足最坏情况峰值而过度建设永久性基础设施的必要性。Emerald AI 创始人兼首席执行官 Varun Sivaram 表示:“有了这项技术,AI 工厂变成了友好且有助益的电网资产。同时,AI 工厂可以更快接入电网,因为它们能够利用现有的输电能力。”
压力缓解者,而非性能削减者
在 Nebius AI 工厂的演示中,尽管为了配合全国性的“喝茶高峰”迅速调低了能耗,但 Emerald AI Conductor 确保了高优先级的 AI 工作负载仍保持在峰值吞吐量下运行,仅暂时放缓了部分灵活性较高的作业。
Emerald AI 记录显示,在 EPRI 和 National Grid 指令下,AI 集群对 200 多个功率目标的响应达成率达到 100%。
National Grid 集团首席战略官 Steve Smith 指出:“我们进行的测试超越了目前美国已有的范畴,因为我们不仅测试了 GPU,还测试了 CPU 以及周边所有 IT 设备的总功耗。我们已经证明了这项技术带来的价值。”
助力伦敦电网的高速扩张
伦敦的电网正不断努力满足市民日益增长的能源需求。其电网运营商面临一个关键瓶颈:在连接大型客户时的基础设施升级限制。将灵活的 AI 工厂接入电网,不仅有助于平抑能源高峰,还能优化现有基建的使用率,从而为英国培育新的人才和经济机会。
目前,Emerald AI 和英伟达正准备将这种“电力灵活”的 AI 工厂模式投入实战,位于弗吉尼亚州的 Aurora AI 工厂将于今年投入运营。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区