首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
5842
篇文章
累计创建
2040
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
GPU加速
相关的文章
2025-12-19
如何使用Unsloth和QLoRA在本地数据集上微调Mistral或Llama 3模型
2025-12-19
0
0
0
AI基础/开发
AI工具应用
2025-12-18
大模型的应用落地:从“聊天盒子”到企业级生产力工具
2025-12-18
0
0
0
AI行业应用
AI工具应用
2025-12-18
OpenUSD 与 NVIDIA Halos 加速机器人出租车和物理 AI 系统的安全性
本文探讨了 NVIDIA 如何利用 OpenUSD 框架和 NVIDIA Halos 技术栈,为机器人出租车和物理 AI 系统提供更安全、更可靠的开发和部署路径。通过结合开放标准、高保真模拟和先进的合成数据生成技术,NVIDIA 正在加速下一代自动驾驶和机器人技术的落地。
2025-12-18
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-16
针对提示注入的有效防御方法:StruQ和SecAlign
提示注入已成为LLM应用面临的首要威胁。本文介绍了两种无需额外计算成本的微调防御方法:StruQ和SecAlign。它们能将多种优化无关攻击的成功率降至接近0%,同时SecAlign使优化攻击的成功率降低了4倍以上,有效提升了LLM系统的安全性。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
2025-12-16
挑战英伟达:谷歌携手联发科加速量产 AI 芯片,TPU v7e 订单直接翻倍
谷歌旗下 AI 芯片 TPU 近期需求爆发,为确保下一代 TPU v7e 芯片供应,已将给联发科的订单量直接翻倍。为应对供不应求的局面,谷歌不再单纯依赖博通,而是引入联发科作为关键合作伙伴,旨在通过多元化供应商策略降低风险。此举被视为谷歌挑战英伟达市场地位的重要战术考量,核心在于利用联发科与台积电的紧密合作关系,争取稀缺的 CoWoS 先进封装产能。Anthropic 等重量级客户已签署基于 TPU 的基础设施部署协议,显示了 TPU 在定制化芯片领域的强大影响力。
2025-12-16
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-15
AI已成一切的核心 NVIDIA表态:我们没放弃64位计算
随着AI的爆发式发展,芯片计算的重点正从传统的FP64(64位浮点计算)转向FP16、FP8等低精度计算,这引起了科学计算领域对HPC性能下降的担忧。特别是NVIDIA的Blackwell架构,其FP64性能相较于前代产品出现大幅下滑。对此,NVIDIA负责HPC业务的高级总监Dion Harris明确表示,公司并未放弃64位计算,它依然是核心。他指出,通过新的cuBLAS数学库可以在矢量核心上有效模拟FP64计算,性能可提升1.8倍,并承诺未来GPU将在底层提升FP64计算能力。
2025-12-15
0
0
0
AI基础/开发
AI行业应用
2025-12-15
DEEPX发布AI视觉芯片DX-H1:单芯30W可处理数百路视频流
DEEPX(迪普爱思)重磅推出首款视觉神经网络处理单元(V-NPU)芯片DX-H1,该芯片荣获CES 2026创新奖。其核心亮点在于超低功耗设计,仅需30W功率即可实时处理数百路AI视频流,极大地提升了能效比。DX-H1集成了视频输入、预处理、AI推理及重编码等全流程,显著简化了系统集成度。与传统GPU方案对比,DX-H1在相同通道密度下,可节省约80%的硬件成本和85%的功耗,为高密度AI视觉应用提供了极具竞争力的解决方案。
2025-12-15
0
0
0
AI基础/开发
AI行业应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-12
掌握机器学习部署的10个GitHub仓库
2025-12-12
0
0
0
AI基础/开发
AI工具应用
2025-12-11
谷歌在AI军备竞赛中的答案:提拔其数据中心技术背后的关键人物
谷歌已任命Amin Vahdat为新设立的AI基础设施首席技术专家,直接向CEO桑达尔·皮查伊汇报。此举凸显了AI基础设施的重要性,因为谷歌正投入巨资进行资本支出。Vahdat在构建谷歌AI骨干方面拥有15年的深厚经验,涉及TPU芯片、Jupiter网络和Borg系统,是谷歌AI战略的核心。
2025-12-11
0
0
0
AI新闻/评测
AI行业应用
2025-12-11
英伟达推出可选的数据中心集群管理软件
随着AI基础设施的规模和复杂性不断增长,数据中心运营商迫切需要对GPU集群的性能、温度和功耗进行持续监控。英伟达正为此推出一款可选的、客户可安装的软件解决方案,旨在通过洞察仪表板帮助云合作伙伴和企业最大化GPU正常运行时间,提升能效和可靠性。
2025-12-11
0
0
0
AI新闻/评测
AI工具应用
2025-12-11
英伟达正在为工业革命提供动力的三种方式
本文深入探讨了英伟达加速计算平台如何取代CPU,成为AI和科学创新的引擎,并阐述了GPU如何驱动AI训练、微调和推理这“三大扩展定律”。文章强调了从CPU到GPU的计算范式转变,展示了GPU在能效和性能上的巨大优势,以及AI向实体世界扩展的未来前景。
2025-12-11
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-05
加量不加价:OpenAI 最强编程 AI 模型 API 开放,连续写代码可超 24 小时
OpenAI 正式向开发者开放了其最强编程模型 GPT-5.1-Codex-Max 的 API 接口,定价与 GPT-5 保持一致,实现了“加量不加价”。该模型引入了创新的“压缩技术”,使其能够在处理超过百万 Token 的超长上下文时保持高效,并实现了连续运行超过 24 小时而不中断的突破性表现。GPT-5.1-Codex-Max 专门针对 Windows 环境进行了优化训练,性能在 SWE-Bench Verified 测试中显著优于常规版本,目前已集成到 Cursor 和 GitHu...
2025-12-05
0
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-12-05
微软否认下调 AI 销售指标,增长目标≠销售配额
微软近日正式否认了《The Information》关于下调 AI 产品销售增长目标的报道,强调媒体错误地混淆了“增长目标”与“销售配额”的概念。尽管微软驳斥了配额下调的指控,但有报道指出,部分团队的增长预期已调整至 25% 左右。此外,有企业客户因 Copilot Studio 技术问题减少使用,这凸显了生成式 AI 技术在实际部署中仍面临挑战。市场正关注微软如何平衡巨额 AI 投入、技术落地与商业回报之间的关系。
2025-12-05
0
0
0
AI新闻/评测
AI行业应用
2025-12-04
防御提示注入:StruQ和SecAlign的微调防御方法
提示注入是LLM应用面临的首要威胁。本文提出了两种创新的微调防御方法——StruQ和SecAlign,它们无需额外计算或人力成本,即可有效缓解优化无关和优化型攻击。研究表明,SecAlign能将强攻击的成功率降至15%以下,同时保持模型实用性。
2025-12-04
0
0
0
AI基础/开发
AI工具应用
2025-12-04
掌握“氛围式编程”的10个GitHub仓库推荐
2025-12-04
1
0
0
AI工具应用
AI基础/开发
2025-12-01
如何加速语言模型的训练
语言模型训练涉及大量的计算资源和时间,本指南深入探讨了多种加速训练过程的有效策略。文章详细介绍了从硬件优化到软件配置的各个方面,包括采用混合精度训练、使用梯度累积以模拟更大的批次大小、以及实施高效的数据加载和模型并行化技术。掌握这些方法可以显著缩短模型开发周期,提高训练效率,从而加速AI创新。
2025-12-01
0
0
0
AI基础/开发
AI工具应用
2025-11-28
与谷歌合作设计TPU,联发科股价创2002年以来最佳单周表现
联发科股价近期录得自2002年以来的最佳单周表现,单周涨幅高达22%,主要得益于其与谷歌在人工智能领域的深度合作。此次合作的核心是共同设计张量处理单元(TPU),旨在为AI应用提供Nvidia芯片的潜在替代方案。分析师认为,谷歌TPU业务的增长潜力有望抵消智能手机市场疲软带来的影响。瑞银预测,联发科2027年TPU业务销售额将大幅增至40亿美元,并可能在2028年贡献公司20%的营业利润,显示出AI算力市场对联发科未来增长的巨大推动作用。
2025-11-28
0
0
0
AI行业应用
AI基础/开发
AI新闻/评测
1
2
3
4
5