首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4195
篇文章
累计创建
1543
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
GPU加速
相关的文章
2025-12-16
挑战英伟达:谷歌携手联发科加速量产 AI 芯片,TPU v7e 订单直接翻倍
谷歌旗下 AI 芯片 TPU 近期需求爆发,为确保下一代 TPU v7e 芯片供应,已将给联发科的订单量直接翻倍。为应对供不应求的局面,谷歌不再单纯依赖博通,而是引入联发科作为关键合作伙伴,旨在通过多元化供应商策略降低风险。此举被视为谷歌挑战英伟达市场地位的重要战术考量,核心在于利用联发科与台积电的紧密合作关系,争取稀缺的 CoWoS 先进封装产能。Anthropic 等重量级客户已签署基于 TPU 的基础设施部署协议,显示了 TPU 在定制化芯片领域的强大影响力。
2025-12-16
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-15
AI已成一切的核心 NVIDIA表态:我们没放弃64位计算
随着AI的爆发式发展,芯片计算的重点正从传统的FP64(64位浮点计算)转向FP16、FP8等低精度计算,这引起了科学计算领域对HPC性能下降的担忧。特别是NVIDIA的Blackwell架构,其FP64性能相较于前代产品出现大幅下滑。对此,NVIDIA负责HPC业务的高级总监Dion Harris明确表示,公司并未放弃64位计算,它依然是核心。他指出,通过新的cuBLAS数学库可以在矢量核心上有效模拟FP64计算,性能可提升1.8倍,并承诺未来GPU将在底层提升FP64计算能力。
2025-12-15
0
0
0
AI基础/开发
AI行业应用
2025-12-15
DEEPX发布AI视觉芯片DX-H1:单芯30W可处理数百路视频流
DEEPX(迪普爱思)重磅推出首款视觉神经网络处理单元(V-NPU)芯片DX-H1,该芯片荣获CES 2026创新奖。其核心亮点在于超低功耗设计,仅需30W功率即可实时处理数百路AI视频流,极大地提升了能效比。DX-H1集成了视频输入、预处理、AI推理及重编码等全流程,显著简化了系统集成度。与传统GPU方案对比,DX-H1在相同通道密度下,可节省约80%的硬件成本和85%的功耗,为高密度AI视觉应用提供了极具竞争力的解决方案。
2025-12-15
0
0
0
AI基础/开发
AI行业应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-11
谷歌在AI军备竞赛中的答案:提拔其数据中心技术背后的关键人物
谷歌已任命Amin Vahdat为新设立的AI基础设施首席技术专家,直接向CEO桑达尔·皮查伊汇报。此举凸显了AI基础设施的重要性,因为谷歌正投入巨资进行资本支出。Vahdat在构建谷歌AI骨干方面拥有15年的深厚经验,涉及TPU芯片、Jupiter网络和Borg系统,是谷歌AI战略的核心。
2025-12-11
0
0
0
AI新闻/评测
AI行业应用
2025-12-11
英伟达推出可选的数据中心集群管理软件
随着AI基础设施的规模和复杂性不断增长,数据中心运营商迫切需要对GPU集群的性能、温度和功耗进行持续监控。英伟达正为此推出一款可选的、客户可安装的软件解决方案,旨在通过洞察仪表板帮助云合作伙伴和企业最大化GPU正常运行时间,提升能效和可靠性。
2025-12-11
0
0
0
AI新闻/评测
AI工具应用
2025-12-11
英伟达正在为工业革命提供动力的三种方式
本文深入探讨了英伟达加速计算平台如何取代CPU,成为AI和科学创新的引擎,并阐述了GPU如何驱动AI训练、微调和推理这“三大扩展定律”。文章强调了从CPU到GPU的计算范式转变,展示了GPU在能效和性能上的巨大优势,以及AI向实体世界扩展的未来前景。
2025-12-11
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-05
加量不加价:OpenAI 最强编程 AI 模型 API 开放,连续写代码可超 24 小时
OpenAI 正式向开发者开放了其最强编程模型 GPT-5.1-Codex-Max 的 API 接口,定价与 GPT-5 保持一致,实现了“加量不加价”。该模型引入了创新的“压缩技术”,使其能够在处理超过百万 Token 的超长上下文时保持高效,并实现了连续运行超过 24 小时而不中断的突破性表现。GPT-5.1-Codex-Max 专门针对 Windows 环境进行了优化训练,性能在 SWE-Bench Verified 测试中显著优于常规版本,目前已集成到 Cursor 和 GitHu...
2025-12-05
0
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-12-05
微软否认下调 AI 销售指标,增长目标≠销售配额
微软近日正式否认了《The Information》关于下调 AI 产品销售增长目标的报道,强调媒体错误地混淆了“增长目标”与“销售配额”的概念。尽管微软驳斥了配额下调的指控,但有报道指出,部分团队的增长预期已调整至 25% 左右。此外,有企业客户因 Copilot Studio 技术问题减少使用,这凸显了生成式 AI 技术在实际部署中仍面临挑战。市场正关注微软如何平衡巨额 AI 投入、技术落地与商业回报之间的关系。
2025-12-05
0
0
0
AI新闻/评测
AI行业应用
2025-12-04
防御提示注入:StruQ和SecAlign的微调防御方法
提示注入是LLM应用面临的首要威胁。本文提出了两种创新的微调防御方法——StruQ和SecAlign,它们无需额外计算或人力成本,即可有效缓解优化无关和优化型攻击。研究表明,SecAlign能将强攻击的成功率降至15%以下,同时保持模型实用性。
2025-12-04
0
0
0
AI基础/开发
AI工具应用
2025-12-04
掌握“氛围式编程”的10个GitHub仓库推荐
2025-12-04
1
0
0
AI工具应用
AI基础/开发
2025-12-01
如何加速语言模型的训练
语言模型训练涉及大量的计算资源和时间,本指南深入探讨了多种加速训练过程的有效策略。文章详细介绍了从硬件优化到软件配置的各个方面,包括采用混合精度训练、使用梯度累积以模拟更大的批次大小、以及实施高效的数据加载和模型并行化技术。掌握这些方法可以显著缩短模型开发周期,提高训练效率,从而加速AI创新。
2025-12-01
0
0
0
AI基础/开发
AI工具应用
2025-11-28
与谷歌合作设计TPU,联发科股价创2002年以来最佳单周表现
联发科股价近期录得自2002年以来的最佳单周表现,单周涨幅高达22%,主要得益于其与谷歌在人工智能领域的深度合作。此次合作的核心是共同设计张量处理单元(TPU),旨在为AI应用提供Nvidia芯片的潜在替代方案。分析师认为,谷歌TPU业务的增长潜力有望抵消智能手机市场疲软带来的影响。瑞银预测,联发科2027年TPU业务销售额将大幅增至40亿美元,并可能在2028年贡献公司20%的营业利润,显示出AI算力市场对联发科未来增长的巨大推动作用。
2025-11-28
0
0
0
AI行业应用
AI基础/开发
AI新闻/评测
2025-11-28
摩尔线程发布Torch-MUSA v2.7.0:专属算子数量突破1050个
摩尔线程近期连续发布了PyTorch深度学习框架的MUSA扩展库Torch-MUSA的v2.5.0和v2.7.0版本,显示出对AI生态建设的持续投入。最新发布的v2.7.0版本集成了muSolver和muFFT计算加速库,并新增了对统一内存设备(UMM)的支持,优化了内存使用效率。目前,该库专属支持的算子总数已超过1050个,极大地增强了基于MUSA架构国产全功能GPU在大模型训练与推理方面的性能与稳定性,为国产AI计算生态提供了坚实的基础支持。
2025-11-28
0
0
0
AI基础/开发
AI工具应用
2025-11-28
作为专业数据科学家,我离不开的7款AI工具
一名专业数据科学家分享了其日常工作流中不可或缺的七大人工智能工具,这些工具极大地提升了其编码效率、数据分析的智能性和工作流程的自动化水平。从增强写作的Grammarly到本地部署的llama.cpp,再到多模型研究平台You.com和代码编辑器Cursor,作者详细介绍了这些AI助手如何帮助他更快地交付机器学习项目、优化文档编写和简化数据实验。这些工具不仅是效率的倍增器,更是新一代AI驱动工作范式的核心支撑。
2025-11-28
0
0
0
AI工具应用
AI基础/开发
2025-11-26
AWS HyperPod 现在支持多实例 GPU,以最大化生成式 AI 任务的 GPU 利用率
AWS HyperPod 现已全面支持多实例 GPU (MIG),该功能可显著提高大型语言模型(LLM)的训练和推理效率。通过将单个物理 GPU 划分为最多 7 个独立的实例,MIG 允许用户更灵活地分配和利用 GPU 资源,特别适合于需要处理中小型工作负载和推理任务的场景,从而最大化 GPU 投资回报。
2025-11-26
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-11-25
使用 SageMaker HyperPod 上的交互式 IDE 增强您的机器学习工作流
本文详细介绍了 Amazon SageMaker HyperPod 如何通过集成交互式开发环境(如 JupyterLab 和 VS Code)来简化机器学习生命周期。了解管理员如何配置 Amazon SageMaker Spaces,以及数据科学家如何利用这些环境进行高效的开发和训练,实现 GPU 资源的最大化利用和成本优化。
2025-11-25
0
0
0
AI行业应用
AI工具应用
AI基础/开发
1
2
3
4