📢 转载信息
原文链接:https://www.wired.com/story/nvidias-deal-with-meta-signals-a-new-era-in-computing-power/
原文作者:Lauren Goode
询问任何人英伟达(Nvidia)是做什么的,他们很可能会先说“GPU”。几十年来,这家芯片制造商一直以先进的并行计算为定义,而生成式AI的出现以及由此带来的GPU需求的激增,对该公司来说是一笔巨大的财富。
但英伟达近期的举动表明,它正着眼于锁定AI市场中计算需求较低的客户——这些客户不一定需要最强大、最强大的GPU来训练AI模型,而是寻求运行代理式AI软件(agentic AI software)最高效的方法。英伟达最近花费数十亿美元从一家专注于低延迟AI计算的芯片初创公司获得了技术许可,并且作为其最新的超级芯片系统的一部分,开始销售独立的CPU。
昨天,英伟达和Meta宣布,这家社交媒体巨头已同意购买价值数十亿美元的英伟达芯片,为其庞大的基础设施项目提供计算能力——交易中包含了英伟达的CPU。
这项多年协议是两家公司之间持续的良好合作的延伸。Meta 此前估计,到2024年底,它将从英伟达购买 35万块H100芯片,并且到2025年底,该公司将可以使用 总计130万块GPU(但尚不清楚这些是否全部是英伟达的芯片)。
作为最新公告的一部分,英伟达表示,Meta 将“构建针对训练和推理进行优化的超大规模数据中心,以支持公司的长期AI基础设施路线图”。这包括英伟达CPU的“大规模部署”以及“数百万块英伟达Blackwell和Rubin GPU”。
值得注意的是,Meta 是第一家宣布将大规模采购英伟达Grace CPU作为独立芯片的科技巨头,这是英伟达在今年一月发布其新款Vera Rubin超级芯片的完整规格时表示将提供的一种选择。英伟达也一直在强调,作为其计算能力的“从头到尾(soup-to-nuts)方法”的一部分,它提供了连接各种芯片的技术,一位分析师如此评价。
技术市场研究公司 Creative Strategies 的首席执行官兼首席分析师 Ben Bajarin 表示,此举表明英伟达认识到,越来越多的AI软件现在需要在CPU上运行,就像传统的云应用程序一样。“业界目前对数据中心内CPU如此看好的原因是代理式AI,它对通用CPU架构提出了新的要求,”他说。
芯片通讯 Semianalysis 最近的一份报告强调了这一点。分析师们指出,CPU的使用率正在加速,以支持AI训练和推理,并以OpenAI的微软数据中心为例,其中“现在需要数万个CPU来处理和管理GPU生成的PB级数据,如果没有AI,这种使用场景原本是不需要的。”
然而,Bajarin指出,CPU仍然只是最先进AI硬件系统中的一个组件。Meta 从英伟达购买的GPU数量仍然多于CPU。
“如果你是超大规模运营商之一,你不会将所有推理计算都放在CPU上运行,”Bajarin说。“你只需要确保你运行的任何软件在CPU上的速度足够快,能够与实际上是计算驱动力的GPU架构进行交互。否则,CPU就会成为瓶颈。”
Meta 拒绝就其与英伟达的扩展交易置评。社交媒体巨头在最近的财报电话会议上表示,计划今年将其AI基础设施支出大幅增加到1150亿至1350亿美元之间,高于去年的722亿美元。
英伟达也拒绝就新交易置评,但多年来一直表示,其硬件除了用于前沿AI训练外,也可以用于推理计算需求。两年前,在一次与WIRED的深度访谈中,英伟达创始人兼首席执行官黄仁勋估计,英伟达的业务可能是“60%训练,40%推理”。
去年12月,英伟达宣布将花费200亿美元从芯片初创公司 Groq 处获得技术许可,并将 Groq 的一些顶尖人才(包括CEO Jonathan Ross)吸收到英伟达麾下。根据 Groq 的一份声明,这项交易反映了“共同专注于以高性价比加速AI推理的普及”。这笔交易是英伟达迄今为止最大的投资。
竞争加剧
英伟达与Meta的交易正值最知名的AI实验室和万亿美元软件公司寻求计算能力来源多元化之际。OpenAI、Anthropic、Meta、xAI 等公司在过去几年训练和部署生成式AI模型时,都依赖英伟达硬件来完成繁重的工作。
现在,在很多情况下,它们正在构建或定制自己的芯片,这对英伟达提供更多服务构成了压力。
微软依靠英伟达GPU和定制设计的芯片来提供其AI云服务。谷歌也在云服务中使用英伟达芯片,但主要依靠其自家的 Tensor Processing Units (TPUs) 来训练和部署其先进的AI模型。据报道,谷歌还曾考虑 将其TPU出售给Meta。
Anthropic 为其 Claude AI 模型使用了英伟达GPU、谷歌TPU 以及来自亚马逊(其最重要的少数股东之一)的芯片。(Anthropic 联合创始人兼CEO Dario Amodei 也是少数几位公开批评黄仁勋游说美国政府允许英伟达向中国出售先进芯片的高管之一。)
去年与英伟达签署了一项可能价值高达1000亿美元的巨额AI基础设施协议的 OpenAI,公开表示它正在与 Broadcom 合作,创建自己的AI芯片硬件和网络系统。
OpenAI 首席执行官 Sam Altman 去年6月与 AMD 首席执行官 Lisa Su 一同登上了这家芯片制造商的年度AI大会舞台;两人后来达成协议,OpenAI 将在未来几年购买多达6吉瓦的 AMD 芯片,以换取可能获得 AMD 10%的股份。AMD 以其CPU而闻名,但它也在AI加速器和AI GPU市场中占据份额。
就在两周前,OpenAI 宣布计划使用 Cerebras 的技术,为其平台“增加750兆瓦的超低延迟AI算力”。该交易价值100亿美元——虽然不如其与英伟达的交易大,但也不容忽视。
“AI实验室正在寻求多元化,因为需求确实在变化,但主要原因还是他们无法获得足够多的GPU,”Bajarin说。“他们会去任何能获得芯片的地方寻找。”
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区