📢 转载信息
原文链接:https://blogs.nvidia.com/blog/nvidia-microsoft-ai-superfactories/
原文作者:Ian Buck
为配合本周正在举行的Microsoft Ignite大会,英伟达正在扩大与微软的合作,其中包括在由英伟达Blackwell平台驱动的全新微软Fairwater AI超级工厂中,采用下一代英伟达Spectrum-X以太网交换机。
此次合作带来了Microsoft 365 Copilot的新集成,以及由英伟达RTX PRO 6000 Blackwell服务器版GPU驱动的下一代Azure NC系列虚拟机(VM)的公共预览,英伟达Nemotron的集成将加速Microsoft SQL Server 2025的AI性能,并为Microsoft 365中的AI智能体入职、高性能推理、网络安全和物理AI提供优化能力。
微软的AI超级工厂连接了位于威斯康星州的里程碑式Fairwater数据中心和一个位于佐治亚州亚特兰大的全新最先进设施。这个大规模基础设施将集成数十万个英伟达Blackwell GPU用于大规模训练。此外,微软正在全球部署的英伟达GB300 NVL72系统中,部署超过10万块Blackwell Ultra GPU,用于推理。
微软产品管理企业副总裁Nidhi Chappell表示:“我们与英伟达的合作建立在推动整个系统和全栈(从芯片到服务)创新的基础上。通过将微软Azure无与伦比的数据中心规模与英伟达的加速计算相结合,我们最大限度地提高了AI数据中心的性能和效率,这对引领新AI时代的客户来说至关重要。”
OpenAI、微软AI超级智能团队、Microsoft 365 Copilot和Microsoft Foundry服务的最高要求工作负载将由该基础设施提供支持。像Black Forest Labs这样的客户也正在使用英伟达GB200 NVL72系统来训练驱动视觉智能的下一代多模态FLUX模型。
为了连接这个庞大的基础设施,微软正在其Fairwater AI数据中心——有史以来最大、最复杂的AI工厂——部署下一代英伟达Spectrum-X以太网交换机,提供OpenAI运行大规模AI模型和应用所需的性能、规模和效率。
搭载英伟达RTX PRO 6000 Blackwell GPU的新型Azure NCv6系列VM现已在Azure上进行公共预览,将Blackwell平台扩展到为包括多模态代理AI、使用英伟达Omniverse库进行的工业数字化、科学模拟和视觉计算在内的多种工作负载提供适当规模的加速。这种灵活性从云端延伸到边缘,通过Azure Local,能够在数据需要驻留的任何地方实现低延迟、实时的AI,同时支持强大的主权AI解决方案。
这使得企业能够直接从Azure云到工厂车间、本地数据中心或安全边缘位置,使用英伟达RTX PRO 6000 Blackwell GPU无缝开发、部署和管理AI驱动的数字孪生和生成式AI应用。
软件优化带来可互换的AI集群
Azure上涵盖英伟达Blackwell和Hopper GPU的英伟达平台,加速了微软AI超级智能团队最新的模型,包括文本(MAI-1-preview)、实时语音(MAI-Voice-1)和高保真图像生成(MAI-Image-1)——为Bing Image Creator和Microsoft Copilot带来新的多模态体验。
英伟达与微软合作的核心是构建一个“可互换集群”(fungible fleet)——一个灵活、持续现代化的基础设施,能够以最高的效率加速任何工作负载。这是通过持续的全栈软件优化实现的,这些优化带来了持续的性能提升,并最大限度地提高了整个AI生命周期和Azure上多种英伟达架构的吞吐量。这些优势也延伸到生成式AI之外的工作负载,包括数据处理、向量搜索、数据库、数字孪生、科学计算和3D设计。
这种协同工程为客户节省了大量成本,使原本理论上的AI项目现在变得经济可行。例如,持续的全栈优化工作直接促成了两年内在Azure上向最终用户提供的流行GPT模型价格下降了90%以上。
目前的优化工作已扩展到Microsoft Foundry,其中英伟达TensorRT-LLM库有助于提高各种流行开源模型的吞吐量、降低延迟并降低成本。
英伟达和微软还通过英伟达DGX Cloud基准测试套件合作优化了其集群的AI工作负载性能。两家公司的工程团队紧密合作,识别瓶颈并实施基础设施调优,推动了性能的提升。通过实现英伟达参考架构可能性能的95%,微软被命名为H100训练的Exemplar Cloud。
从智能数据到AI智能体
英伟达和微软正在将AI集成到企业的核心,解锁存储在全球最值得信赖的数据库之一中的数十年专有数据。
英伟达通过将英伟达Nemotron开源模型和英伟达NIM微服务集成到新的Microsoft SQL Server 2025中,来加速AI。该解决方案直接在企业数据所在的位置(云端或本地)提供GPU优化、安全且可扩展的检索增强生成(RAG)。
此外,合作还扩展到工作场所的代理AI新前沿领域。英伟达NeMo Agent Toolkit现已与Microsoft Agent 365连接,使开发人员能够直接构建、部署和入驻合规的企业级AI智能体到Microsoft 365应用生态系统,包括Outlook、Teams、Word和SharePoint。
为了驱动这些新的企业智能体,Microsoft Foundry现通过安全的NIM微服务提供英伟达Nemotron模型用于数字AI,以及英伟达Cosmos模型用于物理AI。开发人员可以利用它们来构建企业级的代理AI,以应对广泛的受益于多模态智能、多语言推理、数学、编码和物理AI能力的应用程序。
此次合作也在应对企业的网络威胁。微软和英伟达正在合作研究基于英伟达Dynamo-Triton框架和英伟达TensorRT工具套件构建的新的对抗性学习模型,与CPU方法相比,这些模型可提供160倍的性能加速,帮助企业防御实时网络安全威胁。
物理AI与工业数字化
英伟达和微软正在构建物理AI的未来。通过在Microsoft Azure上提供英伟达Omniverse库,英伟达正在通过其开发者生态系统,在云端实现端到端的再工业化。开发人员正在变革工业工作流程,从与Synopsys合作的计算机辅助工程到Sight Machine和SymphonyAI支持的工厂运营。
机器人开发者可以利用英伟达Isaac Sim开源机器人仿真框架,解锁关键工作流程,从合成数据生成到所有类型机器人实体(robot embodiments)的软件在环测试。Hexagon主要使用Azure上英伟达的全栈机器人技术来构建其AEON人形机器人。同样,运行在Azure上的机器人平台Wandelbots NOVA集成了Isaac Sim和Isaac Lab,以简化和加速仿真到现实世界的部署。
此外,英伟达和微软正在采用标准化的数字工程方法,以实现3D工作流程中OpenUSD的无缝互操作性,使仿真和数字内容创作能够在云端普及。
此次扩大的合作正值今天早些时候与Anthropic和微软宣布的合作伙伴关系之后。英伟达和Anthropic将合作进行设计和工程,以优化Anthropic模型的性能、效率和总体拥有成本,并优化未来的英伟达架构以适应Anthropic的工作负载。
了解更多关于英伟达和微软在Microsoft Ignite的合作及会议。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区