NVIDIA携手Ineffable Intelligence，共建强化学习基础设施的未来-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://blogs.nvidia.com/blog/ineffable-intelligence-reinforcement-learning-infrastructure/

原文作者：NVIDIA Writers

强化学习智能体——即通过反复试错来学习的AI系统——能够将计算转化为新的知识。这正是NVIDIA与Ineffable Intelligence之间一项工程级深度合作的核心焦点。Ineffable Intelligence是一家位于伦敦的AI实验室，由AlphaGo架构师David Silver在公司上周走出隐身模式后创立。

NVIDIA创始人兼CEO黄仁勋表示：“AI的下一个前沿是‘超级学习者’，即能够从经验中持续学习的系统。我们非常高兴能与Ineffable Intelligence合作，共同设计大规模强化学习的基础设施，助力他们探索AI的前沿，并开创智能系统的新一代。”

作为强化学习领域的先驱之一，Silver曾通过该方法彻底改变了AI研究。他目前的重心是将这一方法进一步发展为一种全新的范式。

“研究人员在很大程度上解决了AI较简单的问题：如何构建拥有人类已知所有知识的系统，”Silver说道，“但现在我们需要解决AI更难的问题：如何构建能够自主发现新知识的系统。这需要一种完全不同的方法——即能够从经验中进行学习的系统。”

构建面向未来的强化学习管道

这种学习需要一个强大且高度优化的管道来支撑。与预训练不同，预训练通常涉及人类数据在系统中流转，而强化学习的工作负载则是在运行过程中即时生成数据。

该系统必须在紧密的循环中持续进行行为触发、观察、评分和更新，这对互联互通、内存带宽和服务提出了不同于传统预训练的严苛要求。此外，系统将在与人类语言和其他人类数据截然不同的丰富经验上进行训练，这可能需要全新的模型架构和训练算法。

这就是NVIDIA和Ineffable当前技术工作的重点所在：构建一个能够支撑大规模强化学习系统的管道。双方工程师已联手探索实现这一训练管道的最佳方案。

这项工作目前正基于 NVIDIA Grace Blackwell 展开，并将成为首批探索即将推出的 NVIDIA Vera Rubin 平台的项目之一。其目标是探索当AI世界从人类数据转向通过模拟和经验学习的模型时，所需的下一代硬件和软件基础设施。

建立完善的基础设施，将解锁在复杂、丰富的环境中进行大规模强化学习的潜力，使智能体能够在所有知识领域实现突破。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

NVIDIA携手Ineffable Intelligence，共建强化学习基础设施的未来

构建面向未来的强化学习管道

评论区