目 录CONTENT

文章目录

微软发布专为AI推理设计的新款芯片Maia 200

Administrator
2026-01-27 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/01/26/microsoft-announces-powerful-new-chip-for-ai-inference/

原文作者:Lucas Ropek


微软发布了其最新的芯片 Maia 200,该公司称其为一款专为扩展AI推理而设计的硅动力工作站。

据该公司称,这款200型号芯片是继公司于2023年发布的Maia 100之后推出的新产品,在技术上已经具备了以更快的速度和更高的效率运行强大AI模型的能力。Maia 配备了超过1000亿个晶体管,在4位精度下可提供超过10 petaflops的性能,在8位精度下可提供约5 petaflops的性能——这比其前代产品有了显著的提升。

推理指的是运行模型的计算过程,这与训练模型所需的计算量不同。随着AI公司的成熟,推理成本已成为其总运营成本中日益重要的一部分,这促使人们对优化该过程的方法重新产生兴趣。

微软希望Maia 200能够成为这种优化的一部分,使AI业务的运行中断更少,功耗更低。该公司表示:“在实际应用中,一个Maia 200节点可以轻松运行当今最大的模型,并且为未来更大的模型留有充足的余地。”

微软的新芯片也是科技巨头们转向自研芯片的一个日益增长的趋势的一部分,此举旨在减少对英伟达的依赖,英伟达的尖端GPU已成为AI公司成功的关键要素。例如,谷歌拥有其TPU(张量处理单元)——它们不是作为芯片出售,而是作为可通过其云平台获取的计算能力。此外,还有亚马逊的Trainium,这是这家电子商务巨头自己的AI加速器芯片,它在去年12月推出了其最新版本Trainium3。在每种情况下,TPU都可以用来分担原本分配给英伟达GPU的部分计算任务,从而降低总体硬件成本。

通过Maia,微软正将自己定位为与这些替代方案竞争。在其周一的新闻稿中,该公司指出,Maia 在FP4性能方面比亚马逊第三代Trainium芯片高出3倍,在FP8性能方面则优于谷歌第七代TPU。

微软表示,Maia 已经“辛勤工作”,为公司Superintelligence团队的AI模型提供动力。它也一直在支持其聊天机器人Copilot的运行。截至周一,该公司表示已邀请包括开发人员、学者和前沿AI实验室在内的各方在其工作负载中使用其Maia 200软件开发工具包。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区