📢 转载信息
原文作者:Steef-Jan Wiggers
IBM Cloud Code Engine,作为IBM战略性的全托管Serverless(无服务器)平台,现已推出集成GPU支持的Serverless Fleets新功能。这项新能力直接解决了在简化的按使用付费的无服务器模型上运行大规模、计算密集型工作负载的挑战,例如企业级AI、生成式AI、机器学习和复杂的模拟任务。
填补Serverless与高性能计算的鸿沟
正如康奈尔大学近期的一篇论文所指出的,历史上,无服务器技术在高效支持这些要求苛刻的并行工作负载方面存在困难,这些工作负载通常需要数千甚至数百万个任务同时使用专业硬件执行。通过Serverless Fleets,IBM旨在通过提供高性能计算资源,同时消除管理专用基础设施的操作复杂性,来弥合这一差距。
Michael Behrendt,Serverless技术主管兼IBM杰出工程师,在领英帖子中评论道:
这项能力的架构在很大程度上是受到了运行包含数十万个处理器的超大规模真实世界工作负载的启发和驱动。它的构建方式极其稳健,可以以几乎零SRE(站点可靠性工程师)人员的投入来运行这些工作负载。
Serverless Fleets如何简化大规模批处理
Serverless Fleets通过提供一个用于提交大量批处理作业的单一终端,简化了数据科学家和开发人员执行计算密集型任务的方式。在IBM的博客文章中提到,Code Engine会自动处理基础设施的编排:
- 该服务自动预配所需的计算资源,包括虚拟机(VM)和无服务器图形处理器(GPU),例如NVIDIA L40,以同时运行多个任务。
- 此外,Serverless Fleets专为“运行至完成”(run-to-completion)的任务设计,可以弹性扩展。系统会确定所需的最佳工作实例数量,并部署它们以高效处理并行执行。
- 最后,一旦工作负载完成,资源会自动移除,确保用户只为执行期间消耗的技术付费。
与竞争对手的对比与优势
随着IBM Cloud Code Engine的Serverless Fleets的推出,该公司带来了极具竞争力的产品。其他主流云服务商,如AWS,提供AWS Fargate来在无服务器计算上运行容器(通常与EKS或ECS配合使用进行编排),而Azure则在容器应用中提供Serverless GPU。然而,IBM强调的是在单一、简单的平台上实现Web应用、函数以及现在大规模、GPU加速批处理作业的统一环境。
在竞争对手可能要求开发人员将多个服务(例如无服务器运行时、容器服务和批处理编排器)拼凑起来的情况下,Serverless Fleets旨在通过一个端点完全管理基于GPU的虚拟机的预配和弹性扩展,从而简化流程,减少运行弹性、GPU密集型工作负载时通常伴随的复杂性和运营开销。Luke Roy在一篇Medium博客文章中总结道:
无论您是在处理媒体处理、AI推理还是科学工作负载,IBM Cloud Code Engine Serverless Fleets都提供了一个强大且对开发者友好的解决方案。
该公司在博客文章中表示,在当今竞争激烈的环境中,各行各业的企业需要快速便捷地交付服务,同时将安全性、弹性与成本节约放在首位。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区