📢 转载信息
原文作者:Steef-Jan Wiggers
IBM Cloud Code Engine重磅升级:集成GPU支持的Serverless Fleets,赋能高性能AI与并行计算
IBM Cloud Code Engine,作为IBM公司完全托管的战略性无服务器(Serverless)平台,现已推出集成GPU支持的Serverless Fleets新功能。借助这一创新能力,IBM旨在简化运行大规模、计算密集型工作负载的挑战,例如企业级人工智能(AI)、生成式AI、机器学习和复杂的科学模拟,这一切都可以在一个简化的、按使用量付费的无服务器模型上实现。
历史上,正如康奈尔大学最近的一篇论文所指出的,无服务器技术在高效支持这些要求苛刻的并行工作负载方面存在困难,这些工作负载通常需要同时执行数千甚至数百万个任务,并依赖专用硬件。通过Serverless Fleets,IBM致力于弥合这一差距,提供高性能计算资源,同时消除了管理专用基础设施所需的操作复杂性。
零SRE介入的大规模工作负载运行能力
Michael Behrendt,IBM Serverless CTO和杰出工程师,在LinkedIn的一篇帖子中评论道:
这项能力的架构很大程度上受到了运行拥有数十万个处理器的真实大型工作负载的启发和驱动。它的构建方式极其稳健,可以实现几乎零SRE(站点可靠性工程师)人员介入的状态来运行这些工作负载。
Serverless Fleets如何简化计算密集型任务?
Serverless Fleets通过提供一个单一的端点来提交大量批处理作业,极大地简化了数据科学家和开发人员执行计算密集型任务的方式。在IBM的一篇博客文章中提到,Code Engine会自动处理基础设施编排:
- 该服务会自动预配必要的计算资源,包括虚拟机(VM)和无服务器图形处理器(GPU),例如NVIDIA L40,以同时运行多个任务。
- 此外,Serverless Fleets专为“运行即完成”(run-to-completion)任务设计,并具备弹性扩展能力。系统会确定所需的最佳工作实例数量,并进行部署以高效处理并行执行。
- 最后,一旦工作负载完成,资源就会被自动移除,确保用户只为执行期间消耗的技术付费。
市场竞争与统一环境的优势
随着IBM Cloud Code Engine的Serverless Fleets的推出,IBM带来了极具竞争力的产品。其他主要的云服务商,如AWS,提供了如AWS Fargate等解决方案来运行容器的无服务器计算(通常与EKS或ECS配合使用),而Azure则在Container Apps中提供服务器无服务器GPU。然而,IBM强调的是一个统一的环境,为Web应用、函数以及现在的大规模、GPU加速的批处理作业提供单一、简单的平台。
在竞争对手可能要求开发者将多种服务(例如,无服务器运行时、容器服务和批处理协调器)拼接起来的情况下,Serverless Fleets旨在通过一个单一端点完全管理GPU支持的虚拟机的预配和弹性扩展,从而简化操作,减少了在云中运行弹性、GPU密集型工作负载通常伴随的复杂性和运营开销。Luke Roy在Medium的一篇博客文章中总结道:
无论您是从事媒体处理、AI推理还是科学工作负载,IBM Cloud Code Engine Serverless Fleets都提供了一个强大且对开发人员友好的解决方案。
该公司在博客文章中表示,在当今的竞争格局中,跨行业的企业需要快速方便地交付服务,同时要优先考虑安全性、弹性和成本节约。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区