首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4960
篇文章
累计创建
1791
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
SageMaker Pipelines
相关的文章
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产
构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系,简化生成式 AI 开发的复杂性,确保模型的可追溯性和可复现性。
2025-12-18
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-16
Amazon SageMaker HyperPod 的无检查点训练:面向更快速故障恢复的生产规模训练
随着基础模型训练的规模不断扩大,传统的基于检查点的恢复方法已成为效率瓶颈。本文介绍了 Amazon SageMaker HyperPod 上的无检查点训练,这是一种范式转变,通过实现对等状态恢复,显著减少了对传统检查点的依赖。生产规模验证结果显示,恢复时间减少了 80%–93%,在数千个 AI 加速器集群上可实现高达 95% 的训练有效吞吐量(Goodput)。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-12
扩展MLflow以支持企业级AI:SageMaker AI中MLflow的新特性
AWS发布了Amazon SageMaker AI中的新MLflow功能,引入了无服务器能力,可动态管理基础设施的预置、扩展和运维。这项更新无需管理员配置,即可实现实验跟踪、可观测性和模型性能评估的自动化,并支持跨账户共享和与SageMaker Pipelines的集成,显著简化了企业级ML和生成式AI工作负载的管理。
2025-12-12
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发