首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
3781
篇文章
累计创建
1406
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
Amazon SageMaker
相关的文章
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型(LLM)推理性能的方法。通过自动化基准测试和参数调优,您可以告别繁琐的手动试错,快速找到满足延迟和吞吐量服务水平协议(SLA)的最佳配置,从而显著提升自托管模型的效率和成本效益。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-23
在 Amazon SageMaker AI 上部署 Mistral AI 的 VoxLlama 模型
本文详细介绍了如何利用 Amazon SageMaker 快速部署 Mistral AI 推出的先进多模态模型 VoxLlama。我们将探讨使用 SageMaker 托管服务部署高性能大语言模型的步骤,为开发者和企业提供了一个高效、可扩展的解决方案,以在云端运行和集成最前沿的 AI 技术。
2025-12-23
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-20
面向Amazon SageMaker Studio推出SOCI索引:为AI/ML工作负载提供更快的容器启动时间
AWS重磅推出Amazon SageMaker Studio的新功能:SOCI(Seekable Open Container Initiative)索引。该功能通过实现容器镜像的延迟加载,显著缩短了AI/ML工作负载的容器启动时间,将等待时间从几分钟缩短到几秒钟。本文详细介绍了SOCI的工作原理、先决条件、创建索引的步骤以及基准测试结果,旨在帮助数据科学家和ML工程师减少环境初始化等待,提高开发效率。
2025-12-20
0
0
0
AI工具应用
AI基础/开发
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产
构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系,简化生成式 AI 开发的复杂性,确保模型的可追溯性和可复现性。
2025-12-18
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-18
使用 Snowflake 集成在 Amazon SageMaker 上通过 MLflow 跟踪机器学习实验
本文介绍了如何将 Amazon SageMaker 托管的 MLflow 与 Snowflake 集成,以实现在数据环境中进行机器学习实验跟踪。通过 Snowpark 库,您可以在 Snowflake 中进行数据处理和特征工程,并利用 SageMaker MLflow 作为中央存储库来记录和监控实验元数据、参数、模型和结果,从而实现更安全、更高效的 MLOps 工作流。
2025-12-18
1
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-17
塔塔电力CoE如何利用Amazon SageMaker AI和Amazon Bedrock构建可扩展的AI驱动太阳能电池板检测解决方案
本文深入探讨了塔塔电力(Tata Power)如何与Oneture Technologies合作,利用AWS服务(包括Amazon SageMaker AI和Amazon Bedrock)构建了一个革命性的AI驱动太阳能电池板安装检测系统。该方案解决了传统手动检测耗时长、可扩展性差和质量不一致的痛点,实现了超过90%的准确率和80%的复检率下降,加速了清洁能源的推广。
2025-12-17
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-16
Amazon SageMaker HyperPod 的无检查点训练:面向更快速故障恢复的生产规模训练
随着基础模型训练的规模不断扩大,传统的基于检查点的恢复方法已成为效率瓶颈。本文介绍了 Amazon SageMaker HyperPod 上的无检查点训练,这是一种范式转变,通过实现对等状态恢复,显著减少了对传统检查点的依赖。生产规模验证结果显示,恢复时间减少了 80%–93%,在数千个 AI 加速器集群上可实现高达 95% 的训练有效吞吐量(Goodput)。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-12
扩展MLflow以支持企业级AI:SageMaker AI中MLflow的新特性
AWS发布了Amazon SageMaker AI中的新MLflow功能,引入了无服务器能力,可动态管理基础设施的预置、扩展和运维。这项更新无需管理员配置,即可实现实验跟踪、可观测性和模型性能评估的自动化,并支持跨账户共享和与SageMaker Pipelines的集成,显著简化了企业级ML和生成式AI工作负载的管理。
2025-12-12
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-10
Amazon SageMaker HyperPod 的托管分层 KV 缓存和智能路由
本文介绍了 Amazon SageMaker HyperPod 中新增的托管分层 KV 缓存和智能路由功能,旨在解决大型语言模型(LLM)推理中因上下文长度增加导致的延迟和成本问题。这些新功能通过优化 KV 缓存管理和请求路由,可将 TTFT 降低高达 40%,并将吞吐量提升高达 24%,显著降低推理成本。
2025-12-10
0
0
0
AI行业应用
AI工具应用
2025-12-04
AWS re:Invent 2025:企业级AI代理和模型定制成最大亮点
AWS re:Invent 2025 大会聚焦企业级AI,重点推出了增强AI代理功能,使其能独立工作数日。首席执行官Matt Garman强调AI代理是释放AI真正价值的关键。此外,AWS还发布了简化定制LLM的工具,如SageMaker的无服务器模型定制和Bedrock的强化微调功能,并展示了Trainium3芯片和企业级AI工厂解决方案。
2025-12-04
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2025-12-02
如何观看和跟进 AWS re:Invent 2025 直播
AWS年度盛会 re:Invent 2025 即将在拉斯维加斯盛大开幕,预计将继续聚焦于AI领域的最新进展。本文为您提供了全程直播和内容跟进的详细指南,包括五场主题演讲和一系列合作伙伴展示的时间表,让您不错过任何重要消息。
2025-12-02
0
0
0
AI新闻/评测
AI行业应用
2025-11-28
使用 Amazon SageMaker AI 评估容器评估模型:Amazon Nova 评估容器
本文详细介绍了如何利用 Amazon SageMaker AI 评估容器中的 Amazon Nova 评估容器来高效评估机器学习模型。了解如何使用此工具进行全面的模型验证和性能基准测试,从而简化 MLOps 流程。
2025-11-28
0
0
0
AI基础/开发
AI工具应用
2025-11-27
CBRE如何利用Amazon Bedrock构建统一的物业管理搜索和数字助理
本文深入探讨了全球最大的商业地产服务公司CBRE如何与AWS合作,利用Amazon Bedrock、Amazon OpenSearch Service等技术,彻底改造其PULSE系统。通过集成生成式AI能力,CBRE成功构建了一个统一的搜索和数字助理体验,实现了对数百万份结构化和非结构化物业数据的快速、智能访问,极大地提升了物业管理专业人员的生产力。
2025-11-27
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-11-27
加州大学洛杉矶分校利用 AWS 生成式 AI 服务打造沉浸式剧院体验
本文详细介绍了加州大学洛杉矶分校(UCLA)如何利用AWS的生成式AI服务(包括Amazon SageMaker AI和Amazon Bedrock)为音乐剧《Xanadu》构建了一套实时、事件驱动的AI微服务。该系统支持观众通过移动设备创作内容,并在演出中实时生成2D图像和3D网格,实现了创新的沉浸式互动体验。
2025-11-27
0
0
0
AI新闻/评测
AI行业应用
AI工具应用
2025-11-27
Amazon SageMaker HyperPod 现支持托管分层 KV 缓存和智能路由
为应对长文档和多轮对话带来的LLM推理性能挑战,AWS推出Amazon SageMaker HyperPod的托管分层KV缓存和智能路由功能。这些新特性通过优化注意力缓存管理和请求分发,能将首个Token时间(TTFT)最多降低40%,吞吐量提升,并将成本降低高达25%,显著提升了生产级LLM部署的效率和经济性。
2025-11-27
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-11-27
Condé Nast 如何利用 Amazon Bedrock 加速合同处理和权利分析
百年媒体巨头Condé Nast面临合同管理复杂性挑战,传统手动流程导致效率低下和收入机会流失。本文深入探讨Condé Nast如何与AWS合作,利用Amazon Bedrock和Anthropic的Claude模型,构建了一个自动化的合同处理与权利分析解决方案,将处理时间从数周缩短至数小时,显著提升了运营效率和知识可及性。
2025-11-27
0
0
0
AI行业应用
AI工具应用
AI新闻/评测
2025-11-25
使用 Amazon Bedrock 自定义模型导入部署 GPT-OSS 模型
Amazon Bedrock 自定义模型导入现已支持 OpenAI 的开放权重模型,如 GPT-OSS 变体。本文详细演示了如何使用自定义模型导入功能,在 Amazon Bedrock 上部署 GPT-OSS-20B 模型,同时保持与 OpenAI Chat Completions API 的完全兼容性。通过此方法,用户可以在保持原有应用代码不变的情况下,享受 AWS 提供的企业级安全、可扩展性和成本控制。
2025-11-25
0
0
0
AI新闻/评测
AI工具应用
2025-11-25
使用 Amazon Bedrock 自定义模型导入部署 GPT-OSS 模型
本文详细介绍了如何利用 Amazon Bedrock 的自定义模型导入功能,部署 OpenAI 的 GPT-OSS 系列开源权重模型,并保持与现有 OpenAI Chat Completions API 的完全兼容性。通过四个关键步骤,用户可以将 20B 或 120B 参数模型轻松迁移到 AWS 环境中,以享受企业级的安全、扩展性和成本控制。
2025-11-25
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-11-25
使用 SageMaker HyperPod 上的交互式 IDE 增强您的机器学习工作流
本文详细介绍了 Amazon SageMaker HyperPod 如何通过集成交互式开发环境(如 JupyterLab 和 VS Code)来简化机器学习生命周期。了解管理员如何配置 Amazon SageMaker Spaces,以及数据科学家如何利用这些环境进行高效的开发和训练,实现 GPU 资源的最大化利用和成本优化。
2025-11-25
0
0
0
AI行业应用
AI工具应用
AI基础/开发
1
2