首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
3557
篇文章
累计创建
1282
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
模型训练
相关的文章
2025-12-28
使用数据并行在多GPU上训练模型
2025-12-28
0
0
0
AI基础/开发
AI工具应用
2025-12-27
使用数据并行在多GPU上训练模型
2025-12-27
0
0
0
AI基础/开发
AI工具应用
2025-12-25
使用混合精度和梯度检查点在内存受限环境下训练模型
2025-12-25
0
0
0
AI基础/开发
AI工具应用
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产
构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系,简化生成式 AI 开发的复杂性,确保模型的可追溯性和可复现性。
2025-12-18
0
0
0
AI基础/开发
AI工具应用
AI行业应用
2025-12-18
使用 Snowflake 集成在 Amazon SageMaker 上通过 MLflow 跟踪机器学习实验
本文介绍了如何将 Amazon SageMaker 托管的 MLflow 与 Snowflake 集成,以实现在数据环境中进行机器学习实验跟踪。通过 Snowpark 库,您可以在 Snowflake 中进行数据处理和特征工程,并利用 SageMaker MLflow 作为中央存储库来记录和监控实验元数据、参数、模型和结果,从而实现更安全、更高效的 MLOps 工作流。
2025-12-18
1
0
0
AI新闻/评测
AI工具应用
AI基础/开发
2025-12-16
PLAID:从序列数据生成全原子蛋白质结构
在AlphaFold2获得诺贝尔奖的背景下,本文介绍了PLAID(蛋白质结构和序列多模态生成模型),它通过学习蛋白质折叠模型的潜在空间,实现了从序列数据同时生成蛋白质1D序列和3D原子结构。PLAID支持组合式函数和生物体提示,并解决了全原子生成和物种特异性等关键挑战,为药物设计开辟了新途径。
2025-12-16
0
0
0
AI基础/开发
AI工具应用
2025-12-16
数据排毒:训练自己应对混乱、嘈杂的真实世界
2025-12-16
0
0
0
AI基础/开发
AI工具应用
2025-12-16
生成式AI短期内可能无法取代律师的工作
尽管生成式AI通过了律师资格考试,但大型语言模型在法律推理和处理复杂现实问题方面仍存在明显不足。本文探讨了AI在法律工作中的应用现状、面临的局限性以及对律师行业的长期影响,表明AI短期内难以取代律师的战略判断和创造性工作。
2025-12-16
0
0
0
AI新闻/评测
AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施
本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能,它允许机器学习(ML)工作负载根据资源可用性自动伸缩。通过动态调整资源,弹性训练可最大化 GPU 利用率,降低成本,并加速模型开发,同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
2025-12-16
0
0
0
AI工具应用
AI基础/开发
AI行业应用
2025-12-16
Amazon SageMaker HyperPod 的无检查点训练:面向更快速故障恢复的生产规模训练
随着基础模型训练的规模不断扩大,传统的基于检查点的恢复方法已成为效率瓶颈。本文介绍了 Amazon SageMaker HyperPod 上的无检查点训练,这是一种范式转变,通过实现对等状态恢复,显著减少了对传统检查点的依赖。生产规模验证结果显示,恢复时间减少了 80%–93%,在数千个 AI 加速器集群上可实现高达 95% 的训练有效吞吐量(Goodput)。
2025-12-16
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-16
使用Unsloth在NVIDIA GPU上微调LLM的方法
本文介绍了如何利用Unsloth框架,结合NVIDIA RTX AI PC和DGX Spark,高效微调大型语言模型(LLM)。Unsloth优化了在NVIDIA GPU上的训练,实现更快的速度和更低的内存消耗。文章详细对比了参数高效微调、全模型微调和强化学习等方法,并介绍了全新的NVIDIA Nemotron 3开源模型家族,助您构建个性化AI助手和智能体。
2025-12-16
0
0
0
AI基础/开发
AI工具应用
2025-12-13
因AI生成大量未经许可的经典卡通形象,迪士尼指控谷歌大规模侵犯版权
迪士尼已向谷歌发出停止侵权函,指控谷歌利用AI模型和相关服务大规模侵犯版权,并通过生成、分发图像和视频进行商业化使用。迪士尼律师指出,谷歌未经授权复制了大量其作品作为AI训练素材,并借助AI系统向公众输出相关内容。侵权内容涉及《冰雪奇缘》、《狮子王》、《星球大战》等经典IP角色。迪士尼要求谷歌立即停止生成衍生内容,并在其AI服务中加入技术限制,防止未来生成侵权内容,强调不会容忍对作品的未经授权商业使用。
2025-12-13
0
0
0
AI新闻/评测
AI基础/开发
2025-12-12
Bayt 播客:用中文听遍硅谷一手信息,播客界的“沉浸式翻译”来了
本文深度评测了AI驱动的播客工具「Bayt 播客」,它能够将包括英语、日语在内的多语言播客内容,通过AI实时转化为自然流畅的中文音频和文字。对于想要高效获取硅谷一手信息的内容爱好者来说,Bayt提供了播客搜索、一键翻译、声音克隆等功能,极大地降低了理解海外优质内容的门槛,实现了播客界的“沉浸式翻译”。
2025-12-12
0
0
0
AI工具应用
AI相关教程
2025-12-11
英伟达正在为工业革命提供动力的三种方式
本文深入探讨了英伟达加速计算平台如何取代CPU,成为AI和科学创新的引擎,并阐述了GPU如何驱动AI训练、微调和推理这“三大扩展定律”。文章强调了从CPU到GPU的计算范式转变,展示了GPU在能效和性能上的巨大优势,以及AI向实体世界扩展的未来前景。
2025-12-11
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-12-09
创建用于下一个标记预测的 Llama 或 GPT 模型
2025-12-09
0
0
0
AI基础/开发
AI工具应用
2025-12-07
这款AI模型可以直觉地理解物理世界是如何运作的
Meta推出的V-JEPA(视频联合嵌入预测架构)AI模型,通过观察普通视频学习世界运作的物理规律。它摒弃了传统的像素空间预测,转而使用高层抽象的“潜在表征”,展现出类似婴儿对物体永存性的直觉理解,并在物理合理性测试中取得了近乎完美的准确率。
2025-12-07
0
0
0
AI新闻/评测
AI基础/开发
2025-12-05
无需时序差分学习的强化学习:基于分而治之的范式
本文介绍了一种基于“分而治之”范式的强化学习(RL)算法,它不依赖于传统的时序差分(TD)学习,并能有效扩展到长时序任务。文章探讨了从TD学习到蒙特卡洛(MC)方法的局限性,并提出了“分而治之”作为第三种范式。通过在目标条件RL(Goal-conditioned RL)中的成功应用,该新算法“传递性RL(TRL)”展现出解决长期依赖问题的潜力,并在复杂任务上取得了领先性能。
2025-12-05
0
0
0
AI基础/开发
AI工具应用
2025-12-05
坦白从宽:OpenAI 开发新系统教导模型诚实承认自身“不良行为”
OpenAI 正在开发一种名为“忏悔(confession)”的新训练框架,旨在解决大型语言模型中常见的“逢迎式回答”和过度自信臆测的问题。该机制要求模型在给出最终答案后,额外提供一段解释性说明,详细阐述其得出结论的过程,特别是涉及潜在风险行为(如作弊、违反指令)时。有趣的是,模型诚实“承认”这些不良行为反而会获得更高的奖励评分,这种设计专注于提升模型行为的诚实度,而非仅仅是有用性或准确性,是AI安全与透明度的重要一步。
2025-12-05
0
0
0
AI基础/开发
AI新闻/评测
2025-12-04
苹果宣布开源其AI模型FSDP,大幅提升了GPU利用率与训练效率
苹果公司近期宣布开源其全数据并行(Fully Sharded Data Parallel, FSDP)的优化版本,旨在显著提升大型AI模型的训练效率和GPU利用率。此次开源的关键亮点在于,通过引入精细化的内存管理和优化通信策略,将训练大型语言模型的效率提升了高达30%,同时将GPU显存占用降低了近20%。这项技术对资源受限的开发者和研究人员具有重大意义,有助于降低部署和训练尖端AI模型的门槛。FSDP的引入标志着苹果在AI基础设施领域的积极贡献,推动了开源社区的创新。
2025-12-04
0
0
0
AI基础/开发
AI工具应用
2025-12-04
OpenAI 收购 Neptune,以加强其在AI模型训练监控方面的能力
人工智能巨头OpenAI已正式宣布收购Neptune公司,这是一家专注于为AI模型训练过程提供监控与调试工具的初创企业。此次收购旨在深化OpenAI对模型学习过程的洞察力,并计划将Neptune的工具深度集成到其训练技术栈中。Neptune的首席执行官透露,双方此前已有合作基础,收购完成后将停止对外服务。OpenAI今年已完成多项重要收购,此次并购进一步凸显了其在AI基础设施和模型可观测性方面的战略投入,以应对日益复杂的模型训练需求。
2025-12-04
0
0
0
AI新闻/评测
AI基础/开发
1
2