首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5939
篇文章
累计创建
2129
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
部署运维
相关的文章
2025-12-27
使用数据并行在多GPU上训练模型
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-27
初学者必看的5个有趣Docker项目
想要通过实践掌握Docker技能的初学者,可以从五个有趣且实用的项目中入手。这些项目涵盖了使用Docker托管静态网站、构建多容器应用(如Flask后端与Redis数据库)、共享数据库、实现Jenkins自动化持续集成,以及搭建Prometheus和Grafana进行日志和性能监控。通过亲手操作,您将不仅理解Docker的核心概念,还能掌握部署、管理和观测容器化应用的关键技能,有效避免“在我机器上可以运行”的问题,从而简化开发和部署流程。
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-26
使用 BentoML 的 LLM-Optimizer 在 Amazon SageMaker AI 上优化 LLM 推理
本文深入探讨了在 Amazon SageMaker AI 上使用 BentoML 的 LLM-Optimizer 来系统化优化大型语言模型(LLM)推理性能的方法。通过自动化基准测试和参数调优,您可以告别繁琐的手动试错,快速找到满足延迟和吞吐量服务水平协议(SLA)的最佳配置,从而显著提升自托管模型的效率和成本效益。
2025-12-26
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-25
使用 BentoML 的 LLM-Optimizer 优化 Amazon SageMaker AI 上的 LLM 推理
本文深入探讨了如何在 Amazon SageMaker AI 上利用 BentoML 的 LLM-Optimizer 工具,系统性地优化大型语言模型(LLM)的推理性能。面对自托管模型的成本和复杂性,LLM-Optimizer 提供了自动化的参数基准测试和搜索流程,以平衡吞吐量和延迟。通过 Qwen-3-4B 模型的实际部署案例,文章展示了如何找到最优的张量并行、批处理大小和并发限制配置,实现比基线高出 2.7 倍的吞吐量提升,确保生产环境下的服务水平目标。
2025-12-25
1
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-25
Agent Lightning:无需重写代码即可为 AI 智能体添加强化学习
本文介绍了 Agent Lightning,一种创新性的方法,允许开发者在不修改现有 AI 智能体代码的情况下,为其注入强化学习能力。这项技术通过添加可学习的控制器来优化智能体行为,显著提升了其性能和决策能力,为构建更强大的智能体开辟了新的途径。
2025-12-25
0
0
0
AI基础/开发
AI工具应用
2025-12-24
全球首款免遥控机器狗预售:9988元,全地形都能去
维他动力(Vbot)近日发布了全球首款免遥控机器狗“大头BoBo”,并开启预售,首发价低至9988元。这款机器狗的核心突破在于其“免遥控”设计,融合了本体智能、空间智能和Agent智能三层架构。它配备了128 TOPS的AI算力平台、360度激光雷达和双目视觉系统,能实现全场景自主感知、避障和路径规划。凭借1:1大小腿设计和高扭矩电机,大头BoBo能稳定穿越台阶、草地等复杂地形,实现真正的全地形适应。该产品在预售期间订单火爆,显示出市场对智能机器人应用前景的强烈兴趣。
2025-12-24
1
0
0
AI工具应用
AI行业应用
2025-12-24
使用 Weights & Biases Weave 和 Amazon Bedrock AgentCore 加速企业 AI 开发
随着企业对生成式AI的应用加速,从概念验证到生产部署需要强大的开发、评估和监控工具。本文演示了如何结合Amazon Bedrock(FM)和AgentCore与W&B Weave,实现从跟踪单个FM调用到监控复杂Agent工作流的全生命周期管理,显著加速企业级AI解决方案的构建、评估与生产部署。
2025-12-24
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-23
在 Amazon SageMaker AI 上部署 Mistral AI 的 VoxLlama 模型
本文详细介绍了如何利用 Amazon SageMaker 快速部署 Mistral AI 推出的先进多模态模型 VoxLlama。我们将探讨使用 SageMaker 托管服务部署高性能大语言模型的步骤,为开发者和企业提供了一个高效、可扩展的解决方案,以在云端运行和集成最前沿的 AI 技术。
2025-12-23
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-22
如何以经济实惠的方式托管语言模型
2025-12-22
1
0
0
AI基础/开发
AI工具应用
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产
构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系,简化生成式 AI 开发的复杂性,确保模型的可追溯性和可复现性。
2025-12-18
1
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-17
使用 Amazon Bedrock 运维生成式 AI 工作负载并扩展到数百个用例 – 第 1 部分:GenAIOps
本文是关于生成式 AI 运营(GenAIOps)的系列文章第一部分,重点介绍了如何将 DevOps 原则应用于 Amazon Bedrock 驱动的生成式 AI 工作负载。我们将探讨 GenAIOps 如何帮助企业应对扩展、安全性和治理等挑战,并展示在探索、生产和重塑三个阶段中实施关键实践的策略。
2025-12-17
1
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-16
使用 Amazon Bedrock 运行生成式 AI 工作负载并扩展到数百个用例 – 第 1 部分:GenAIOps
企业正快速将生成式AI从实验推向生产,面临扩展、安全和治理的新挑战。本文介绍生成式AI运维(GenAIOps),即DevOps原则在生成式AI中的应用,并展示如何使用Amazon Bedrock实现GenAIOps实践。重点讲解了如何演进DevOps架构、管理数据、建立开发环境和评估性能,为构建和扩展生产级生成式AI应用提供实用的实施策略。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-16
使用 Amazon S3 客户端优化机器学习训练的数据加载最佳实践
本文深入探讨了在机器学习训练中使用 Amazon S3 客户端时,如何优化数据加载性能。我们将重点介绍数据分片大小(100MB-1GB)、顺序访问模式以及利用 S3 客户端(如 S3 Connector for PyTorch)来避免 I/O 瓶颈,确保 GPU 资源得到充分利用,从而显著提升训练吞吐量。
2025-12-16
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-16
使用 Amazon Bedrock 运营生成式 AI 工作负载并扩展到数百个用例 - 第 1 部分:GenAIOps
本文是关于Amazon Bedrock的GenAIOps系列的第一部分,重点介绍如何将DevOps原则应用于生成式AI工作负载,以实现规模化、安全和治理。了解如何从探索阶段过渡到生产阶段,并利用Bedrock的功能来管理数据、评估性能和将AI测试集成到CI/CD管道中。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-13
BNY利用OpenAI构建“随处可及的AI”
全球金融机构BNY如何通过采用OpenAI的前沿能力,在内部搭建了名为Eliza的AI部署和教育平台,赋能2万名员工安全、负责任地构建AI代理,推动银行工作方式的深刻变革,实现“AI随处可及”的目标。
2025-12-13
0
0
0
AI行业应用
AI新闻/评测
2025-12-12
使用 Langfuse 为 Amazon Bedrock AgentCore 实现可观测性
本文深入探讨了如何将开源可观测性平台 Langfuse 与 Amazon Bedrock AgentCore 集成,以解决 AI 代理推理过程“不可见”的挑战。通过集成,用户可以获得对 AI 代理性能、交互和任务执行的深度洞察,从而更快地调试问题、优化成本。文章提供了使用 Strands 代理部署在 AgentCore Runtime 上的完整实施指南和代码示例。
2025-12-12
0
0
0
AI工具应用
AI基础/开发
AI新闻/评测
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
1
2
3
4
5