目 录CONTENT

文章目录

IBM Cloud Code Engine重磅升级:引入支持GPU的Serverless Fleets,赋能高性能AI与并行计算

Administrator
2025-10-17 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://www.infoq.com/news/2025/10/ibm-cloud-code-engine-serverless-fleets-with-gpus-for-high-performance-ai-and-parallel-computing/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=global

原文作者:Steef-Jan Wiggers


IBM Cloud Code Engine重磅升级:引入支持GPU的Serverless Fleets,赋能高性能AI与并行计算

IBM Cloud Code Engine,作为IBM的完全托管式战略Serverless平台,现已推出集成GPU支持的Serverless Fleets功能。借助这一全新能力,IBM旨在以简化的按需付费Serverless模型,直接解决在企业AI、生成式AI、机器学习和复杂模拟等大规模、计算密集型工作负载中面临的挑战。

正如包括康奈尔大学近期一篇论文在内的学术研究指出的,Serverless技术在历史上难以高效支持这些要求苛刻的并行工作负载,这些工作负载通常需要同时执行数千甚至数百万个任务,并依赖专用硬件。通过Serverless Fleets,IBM致力于通过提供高性能计算资源,同时消除管理专用基础设施的操作复杂性,来弥合这一差距。

Serverless 和 IBM 杰出工程师(IBM Distinguished Engineer)Michael Behrendt 在领英帖子中评论道:

这项能力的架构在很大程度上受到了运行拥有数十万处理器的大型真实世界工作负载的启发和驱动。它的构建方式极其稳健,能够以几乎零SRE(站点可靠性工程师)人员的成本运行这些工作负载。

简化大规模计算任务提交与执行

Serverless Fleets通过提供一个用于提交大量批处理作业的统一端点,简化了数据科学家和开发人员执行计算密集型任务的方式。在IBM的一篇博客文章中提到,Code Engine随后会自动处理基础设施的编排工作:

  • 该服务会自动配置必要的计算资源,包括虚拟机(VM)和Serverless图形处理器(GPU),例如NVIDIA L40,以同时运行多个任务。
  • 此外,Serverless Fleets专为“运行至完成”的任务设计,并支持弹性扩展。系统会确定所需工作实例的最佳数量,并部署它们以高效处理并行执行。
  • 最后,一旦工作负载完成,资源会自动被移除,确保用户仅需为执行期间所消耗的技术付费。

对标主流云厂商的统一Serverless体验

随着IBM Cloud Code Engine的Serverless Fleets的发布,IBM带来了具有竞争力的产品。其他超大规模云服务商,例如AWS,提供了AWS Fargate等解决方案来运行Serverless计算上的容器(通常与EKS或ECS配合使用进行编排),而Azure则在Container Apps中提供Serverless GPU。然而,IBM的重点是提供一个统一的环境,为Web应用、函数以及现在大规模的GPU加速批处理作业提供单一、简单的平台。

在竞争对手可能要求开发人员将多个服务(例如,Serverless运行时、容器服务和批处理编排器)拼接在一起的情况下,Serverless Fleets旨在通过一个统一的端点全面管理支持GPU的虚拟机的配置和弹性扩展,从而简化流程,减少了在云中运行弹性、GPU密集型工作负载通常伴随的复杂性和运营开销。Luke Roy在Medium的一篇博客文章中总结道:

无论您是从事媒体处理、AI推理还是科学工作负载,IBM Cloud Code Engine Serverless Fleets都提供了一个强大且对开发人员友好的解决方案。

该公司在博客文章中表示,在当今的竞争格局中,各行各业的企业都需要快速、便捷地交付服务,同时优先考虑安全性、弹性和成本节约。




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区