首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
2812
篇文章
累计创建
968
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
部署运维
相关的文章
2025-12-04
AWS re:Invent 2025:企业级AI代理和模型定制成最大亮点
AWS re:Invent 2025 大会聚焦企业级AI,重点推出了增强AI代理功能,使其能独立工作数日。首席执行官Matt Garman强调AI代理是释放AI真正价值的关键。此外,AWS还发布了简化定制LLM的工具,如SageMaker的无服务器模型定制和Bedrock的强化微调功能,并展示了Trainium3芯片和企业级AI工厂解决方案。
2025-12-04
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2025-12-03
英伟达与AWS扩大全面合作,提供对未来创新至关重要的安全、高性能计算平台
英伟达(NVIDIA)与亚马逊云科技(AWS)在AWS re:Invent大会上宣布深化战略合作,重点整合了NVLink Fusion技术到AWS自研芯片(如下一代Trainium4)和Nitro系统中。此次合作旨在通过统一的软硬件架构,为全球客户提供安全、高性能的AI计算基础设施,加速AI工业革命和主权AI云的部署。
2025-12-03
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2025-12-02
基于 GPT-5.1-Codex-Max 打造更多应用
OpenAI发布了全新的前沿智能体编程模型GPT-5.1-Codex-Max,该模型基于基础推理模型的更新,经过了软件工程、数学、研究等代理任务的训练。它更快、更智能、更具Token效率,并且是首个原生支持跨多个上下文窗口(通过“紧凑化”过程)的模型,能够处理数百万Token的任务,实现项目级重构和深度调试。
2025-12-02
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-02
在NeurIPS上,英伟达推进数字和物理AI的开源模型开发
在NeurIPS大会上,英伟达发布了一系列用于语音、安全和自动驾驶的新型AI工具和模型,包括全球首个行业规模的开源推理视觉语言动作(VLA)模型Alpamayo-R1。此外,一项新的独立基准测试认可了NVIDIA Nemotron模型和数据集的开放性和透明度,体现了英伟达对开源社区的持续承诺。
2025-12-02
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-02
2026年值得关注的五大前沿 MLOps 技术
随着生成式和语言模型的加速发展,MLOps(机器学习运维)在人工智能工程领域占据主导地位。到2026年,预计MLOps将继续演进,以下五大前沿技术将塑造行业格局:从嵌入可执行治理规则的“代码即策略”,到专为自主智能体设计的AgentOps;再到运行时可解释性、面向边缘计算和联邦学习的分布式MLOps,以及将能源和碳指标纳入决策的绿色可持续性实践。这些趋势将确保AI系统在保持合规性、可解释性和效率的同时,实现大规模部署。
2025-12-02
0
0
0
AI基础/开发
AI工具应用
2025-12-02
提示词压缩:优化大型语言模型生成并降低成本的五种实用技术
2025-12-02
0
0
0
AI基础/开发
AI工具应用
2025-12-01
如何加速语言模型的训练
语言模型训练涉及大量的计算资源和时间,本指南深入探讨了多种加速训练过程的有效策略。文章详细介绍了从硬件优化到软件配置的各个方面,包括采用混合精度训练、使用梯度累积以模拟更大的批次大小、以及实施高效的数据加载和模型并行化技术。掌握这些方法可以显著缩短模型开发周期,提高训练效率,从而加速AI创新。
2025-12-01
0
0
0
AI基础/开发
AI工具应用
2025-11-30
AI 网络构建:实时智能的基础设施
AI推理就绪网络是实现AI潜能转化为实际性能的关键基础设施。本文以2025年莱德杯赛事为例,深入探讨了AI驱动型网络在处理大规模、实时数据流方面的复杂性和重要性。从超低延迟到专业设备,构建能支持分布式AI应用的下一代网络,正成为企业实现AI价值的关键。
2025-11-30
0
0
0
AI行业应用
AI基础/开发
2025-11-30
实现规模化和生产化AI推理的价值
本文深入探讨了AI价值实现的关键阶段——规模化和生产化的推理。HPE的专家指出,真正的业务转型发生在AI预测转化为实际行动时。文章提出了实现可信赖AI推理规模化的三要素:将信任作为基本原则、数据驱动的执行,以及具备扩展AI能力的IT领导力。同时,详细解析了AI工厂的四象限矩阵,指导企业如何战略性地部署AI资源。
2025-11-30
0
0
0
AI行业应用
AI基础/开发
2025-11-27
使用 Bedrock AgentCore 网关拦截器实现细粒度访问控制
随着企业采用AI代理自动化工作流,安全访问数千个工具成为关键挑战。本文介绍了Amazon Bedrock AgentCore Gateway新推出的网关拦截器功能,它提供了细粒度的访问控制、动态授权和灵活的Schema管理能力,以确保AI代理安全、高效地调用企业工具。
2025-11-27
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-27
使用 AWS Graviton 优化 Mobileye 的 REM™:聚焦 ML 推理和 Triton 集成
Mobileye 深入分享了如何利用 AWS Graviton 优化其 REM™ 系统中的道路变化检测(Change Detection)流程。通过从 GPU 转向 CPU 部署,并集成 Triton 推理服务器,他们不仅解决了资源瓶颈,还实现了超过 2 倍的吞吐量提升,显著优化了成本效益和部署灵活性。
2025-11-27
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-11-27
Amazon SageMaker HyperPod 现支持托管分层 KV 缓存和智能路由
为应对长文档和多轮对话带来的LLM推理性能挑战,AWS推出Amazon SageMaker HyperPod的托管分层KV缓存和智能路由功能。这些新特性通过优化注意力缓存管理和请求分发,能将首个Token时间(TTFT)最多降低40%,吞吐量提升,并将成本降低高达25%,显著提升了生产级LLM部署的效率和经济性。
2025-11-27
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-11-25
使用 Amazon Bedrock 自定义模型导入部署 GPT-OSS 模型
Amazon Bedrock 自定义模型导入现已支持 OpenAI 的开放权重模型,如 GPT-OSS 变体。本文详细演示了如何使用自定义模型导入功能,在 Amazon Bedrock 上部署 GPT-OSS-20B 模型,同时保持与 OpenAI Chat Completions API 的完全兼容性。通过此方法,用户可以在保持原有应用代码不变的情况下,享受 AWS 提供的企业级安全、可扩展性和成本控制。
2025-11-25
0
0
0
AI新闻/评测
AI工具应用
2025-11-25
使用 Amazon Bedrock 自定义模型导入功能部署 GPT-OSS 模型
本文详细介绍了如何利用 Amazon Bedrock 的“自定义模型导入”功能,成功部署 OpenAI 的开源权重 GPT-OSS 模型(包括 20B 和 120B 版本)。通过保持与 OpenAI Chat Completions API 的完全兼容性,企业能够轻松将现有应用迁移到 AWS 平台,享受企业级的安全、扩展性和成本控制优势。文章涵盖了模型准备、S3 上传、Bedrock 导入及 API 调用等关键步骤。
2025-11-25
0
0
0
AI新闻/评测
AI工具应用
2025-11-25
使用 Amazon Bedrock 自定义模型导入部署 GPT-OSS 模型
本文详细介绍了如何利用 Amazon Bedrock 的自定义模型导入功能,部署 OpenAI 的 GPT-OSS 系列开源权重模型,并保持与现有 OpenAI Chat Completions API 的完全兼容性。通过四个关键步骤,用户可以将 20B 或 120B 参数模型轻松迁移到 AWS 环境中,以享受企业级的安全、扩展性和成本控制。
2025-11-25
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-11-25
语言模型开发的5个Docker容器镜像
2025-11-25
0
0
0
AI基础/开发
AI工具应用
2025-11-22
使用多提供商生成式AI网关参考架构简化AI运维
随着企业采用生成式AI,集中管理模型访问至关重要。本文介绍了AWS上的多提供商生成式AI网关参考架构,它利用Amazon Bedrock、SageMaker和开源LiteLLM,提供统一的界面来管理、治理和监控来自多个AI提供商(如OpenAI、Anthropic)的模型调用,简化了操作复杂性和成本控制。
2025-11-22
0
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-11-21
在MCP时代,工具空间干扰:为大规模代理兼容性而设计
本文深入探讨了多智能体协作平台(MCP)时代面临的关键挑战——工具空间干扰。针对大规模代理系统中的资源竞争和兼容性问题,微软研究院提出了引入工具抽象层(TAL)、资源配额和异步调用的设计原则,以构建更稳定、高效和可扩展的代理生态系统。
2025-11-21
0
0
0
AI基础/开发
AI工具应用
2025-11-20
HyperPod 通过安全和存储增强 ML 基础设施
本文深入介绍了 Amazon SageMaker HyperPod 为优化基础模型训练和推理引入的两项关键安全与存储增强功能:客户托管密钥(CMK)支持和 Amazon EBS CSI 驱动程序支持。这些新特性旨在满足大型企业对安全合规性和灵活存储管理的需求,尤其是在生产环境中部署大规模机器学习工作负载时。
2025-11-20
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-11-20
Amazon Bedrock 中 Claude Code 的代码部署模式与最佳实践
本文详细介绍了如何在 Amazon Bedrock 上安全、大规模部署 Anthropic 的 AI 编程助手 Claude Code。内容涵盖了企业推荐的部署架构、身份验证方法的权衡(如 API 密钥、SSO 与直接 IdP 集成),以及基础设施决策(公有端点与 LLM 网关)。重点强调了如何利用 OpenTelemetry 和 CloudWatch 仪表板进行精细化的使用情况、成本和开发效率监控,为企业级 AI 编码工具的落地提供了全面的实践指南。
2025-11-20
0
0
0
AI工具应用
AI基础/开发
AI行业应用
1
2
3