深度学习训练工具箱：PyTorch 2.0 正式发布！训练速度提升 30%-50%-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://news.mydrivers.com/1/1087/1087651.htm

原文作者：佚名

在 PyTorch 2.0 的版本发布中，Meta 宣布推出了深度学习训练工具箱的重大更新。这项更新的核心是引入了新的 torch.compile() 编译 API，该功能旨在通过利用最新的编译器技术来显著提高 PyTorch 代码的性能，而无需用户修改太多代码。

这项更新的主要目标是为 PyTorch 用户提供更好的性能，同时继续保持其动态图的易用性和灵活性。

PyTorch 2.0 的核心更新：torch.compile()

torch.compile() API 是 PyTorch 2.0 的核心亮点。它允许用户通过一个简单的函数调用，在不改变其动态计算图代码的情况下，将 PyTorch 模型转换为优化的、静态图表示。这一过程主要依赖于 TorchDynamo 技术，它能够安全地将 PyTorch 代码分割成可编译的图形片段，然后使用后端（如 TorchInductor）进行优化和编译。

性能提升的关键数据

根据 Meta 提供的基准测试数据，PyTorch 2.0 带来了显著的性能提升：

训练速度：在实际工作负载下，模型训练速度平均提升了 30% 到 50%。
推理速度：在某些推理工作负载下，性能提升幅度甚至超过了 2 倍。

这些性能改进是在保持 PyTorch 动态图易用性的前提下实现的，这使得开发者无需深入了解复杂的底层优化技术，即可获得显著的加速效果。

TorchDynamo：安全分割代码

TorchDynamo 是 PyTorch 2.0 编译堆栈的关键组件。它使用 Python 的帧分析技术来“抓住” PyTorch 操作，从而安全地将用户代码分割成可由后端编译的图形片段。这种方法解决了传统静态编译在处理复杂 Python 控制流时遇到的难题。

“TorchDynamo 的强大之处在于它的安全性。它可以在不破坏用户代码逻辑的情况下，精准地识别出可以被编译的部分，同时优雅地处理那些不能被编译的动态部分。”

后端：TorchInductor

TorchInductor 是 PyTorch 2.0 中推荐的默认后端，它是一个基于 Triton 的张量编译器。Triton 是一种用于编写高性能 GPU 程序的语言，它使得 TorchInductor 能够生成高效的 GPU 内核代码。

通过 torch.compile(model) 的方式，模型会被自动编译，这极大地简化了性能调优的流程。用户只需更新代码并运行，即可享受到编译带来的加速。

保持兼容性与开放性

PyTorch 团队强调，PyTorch 2.0 旨在成为一个“可插拔”的系统。这意味着用户可以选择性地启用 torch.compile()，或者在特定模型上使用不同的后端（如 OpenXLA 或 TensorRT），以实现最佳的性能和兼容性。

同时，PyTorch 2.0 保持了与现有生态系统的兼容性。许多第三方库和工具（如 Hugging Face Transformers、PyTorch Lightning 等）都可以通过简单的配置或升级来兼容 2.0 版本，确保平滑的过渡。

对社区的意义

PyTorch 2.0 的发布标志着 PyTorch 迈向了高性能计算的新阶段。通过自动化优化，它降低了模型训练的门槛，使研究人员和开发者能够更快地迭代模型，专注于模型本身的设计，而不是底层性能调优。

总结来说，PyTorch 2.0 成功地在性能提升和易用性之间取得了平衡，巩固了其作为领先的深度学习框架的地位。

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

深度学习训练工具箱：PyTorch 2.0 正式发布！训练速度提升 30%-50%