模型训练-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

行动起来，活在当下

累计撰写 5276 篇文章
累计创建 1889 个标签
累计收到 0 条评论

目录CONTENT

以下是模型训练相关的文章

2026-01-02
如何利用AI构建一个自己的ChatGPT？
- 2026-01-02
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2026-01-01
使用张量并行在多个GPU上训练大型模型
- 2026-01-01
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-31
使用全分片数据并行（FSDP）在多GPU上训练大型模型
- 2025-12-31
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-31
使用Unsloth在NVIDIA GPU上微调LLM（大型语言模型）本文介绍了如何使用Unsloth框架在NVIDIA RTX PC和DGX Spark上高效微调大型语言模型（LLM）。通过参数高效微调、全模型微调和强化学习等方法，开发者可以定制聊天机器人或个人助理。同时，文章重点介绍了NVIDIA新发布的Nemotron 3开源模型家族，并展示了DGX Spark在本地微调中的强大性能。
- 2025-12-31
- 0
- 0
- 0
2025-12-30
使用流水线并行在多GPU上训练您的大模型
- 2025-12-30
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-28
使用数据并行在多GPU上训练模型
- 2025-12-28
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-25
使用混合精度和梯度检查点在内存受限环境下训练模型
- 2025-12-25
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-18
使用 Amazon SageMaker AI 跟踪和管理 AI 开发中使用的资产构建定制基础模型需要协调数据、计算、模型架构、评估器和部署等多个资产。本文深入探讨了 Amazon SageMaker AI 如何通过自动跟踪和管理数据集版本、自定义评估器以及端到端血缘关系，简化生成式 AI 开发的复杂性，确保模型的可追溯性和可复现性。
- 2025-12-18
- 0
- 0
- 0
2025-12-18
使用 Snowflake 集成在 Amazon SageMaker 上通过 MLflow 跟踪机器学习实验本文介绍了如何将 Amazon SageMaker 托管的 MLflow 与 Snowflake 集成，以实现在数据环境中进行机器学习实验跟踪。通过 Snowpark 库，您可以在 Snowflake 中进行数据处理和特征工程，并利用 SageMaker MLflow 作为中央存储库来记录和监控实验元数据、参数、模型和结果，从而实现更安全、更高效的 MLOps 工作流。
- 2025-12-18
- 1
- 0
- 0
2025-12-16
PLAID：从序列数据生成全原子蛋白质结构在AlphaFold2获得诺贝尔奖的背景下，本文介绍了PLAID（蛋白质结构和序列多模态生成模型），它通过学习蛋白质折叠模型的潜在空间，实现了从序列数据同时生成蛋白质1D序列和3D原子结构。PLAID支持组合式函数和生物体提示，并解决了全原子生成和物种特异性等关键挑战，为药物设计开辟了新途径。
- 2025-12-16
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-16
数据排毒：训练自己应对混乱、嘈杂的真实世界
- 2025-12-16
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-16
生成式AI短期内可能无法取代律师的工作尽管生成式AI通过了律师资格考试，但大型语言模型在法律推理和处理复杂现实问题方面仍存在明显不足。本文探讨了AI在法律工作中的应用现状、面临的局限性以及对律师行业的长期影响，表明AI短期内难以取代律师的战略判断和创造性工作。
- 2025-12-16
- 0
- 0
- 0
- AI新闻/评测
- AI行业应用
2025-12-16
使用 SageMaker HyperPod 弹性训练实现基础模型训练的自适应基础设施本文介绍了 Amazon SageMaker HyperPod 新增的弹性训练功能，它允许机器学习（ML）工作负载根据资源可用性自动伸缩。通过动态调整资源，弹性训练可最大化 GPU 利用率，降低成本，并加速模型开发，同时保持训练质量并最大限度地减少手动干预。我们将深入探讨其工作原理、配置步骤以及性能表现。
- 2025-12-16
- 0
- 0
- 0
2025-12-16
Amazon SageMaker HyperPod 的无检查点训练：面向更快速故障恢复的生产规模训练随着基础模型训练的规模不断扩大，传统的基于检查点的恢复方法已成为效率瓶颈。本文介绍了 Amazon SageMaker HyperPod 上的无检查点训练，这是一种范式转变，通过实现对等状态恢复，显著减少了对传统检查点的依赖。生产规模验证结果显示，恢复时间减少了 80%–93%，在数千个 AI 加速器集群上可实现高达 95% 的训练有效吞吐量（Goodput）。
- 2025-12-16
- 0
- 0
- 0
2025-12-16
使用Unsloth在NVIDIA GPU上微调LLM的方法本文介绍了如何利用Unsloth框架，结合NVIDIA RTX AI PC和DGX Spark，高效微调大型语言模型（LLM）。Unsloth优化了在NVIDIA GPU上的训练，实现更快的速度和更低的内存消耗。文章详细对比了参数高效微调、全模型微调和强化学习等方法，并介绍了全新的NVIDIA Nemotron 3开源模型家族，助您构建个性化AI助手和智能体。
- 2025-12-16
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-13
因AI生成大量未经许可的经典卡通形象，迪士尼指控谷歌大规模侵犯版权迪士尼已向谷歌发出停止侵权函，指控谷歌利用AI模型和相关服务大规模侵犯版权，并通过生成、分发图像和视频进行商业化使用。迪士尼律师指出，谷歌未经授权复制了大量其作品作为AI训练素材，并借助AI系统向公众输出相关内容。侵权内容涉及《冰雪奇缘》、《狮子王》、《星球大战》等经典IP角色。迪士尼要求谷歌立即停止生成衍生内容，并在其AI服务中加入技术限制，防止未来生成侵权内容，强调不会容忍对作品的未经授权商业使用。
- 2025-12-13
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发
2025-12-12
Bayt 播客：用中文听遍硅谷一手信息，播客界的“沉浸式翻译”来了本文深度评测了AI驱动的播客工具「Bayt 播客」，它能够将包括英语、日语在内的多语言播客内容，通过AI实时转化为自然流畅的中文音频和文字。对于想要高效获取硅谷一手信息的内容爱好者来说，Bayt提供了播客搜索、一键翻译、声音克隆等功能，极大地降低了理解海外优质内容的门槛，实现了播客界的“沉浸式翻译”。
- 2025-12-12
- 0
- 0
- 0
- AI工具应用
- AI相关教程
2025-12-11
英伟达正在为工业革命提供动力的三种方式本文深入探讨了英伟达加速计算平台如何取代CPU，成为AI和科学创新的引擎，并阐述了GPU如何驱动AI训练、微调和推理这“三大扩展定律”。文章强调了从CPU到GPU的计算范式转变，展示了GPU在能效和性能上的巨大优势，以及AI向实体世界扩展的未来前景。
- 2025-12-11
- 0
- 0
- 0
2025-12-09
创建用于下一个标记预测的 Llama 或 GPT 模型
- 2025-12-09
- 0
- 0
- 0
- AI基础/开发
- AI工具应用
2025-12-07
这款AI模型可以直觉地理解物理世界是如何运作的 Meta推出的V-JEPA（视频联合嵌入预测架构）AI模型，通过观察普通视频学习世界运作的物理规律。它摒弃了传统的像素空间预测，转而使用高层抽象的“潜在表征”，展现出类似婴儿对物体永存性的直觉理解，并在物理合理性测试中取得了近乎完美的准确率。
- 2025-12-07
- 0
- 0
- 0
- AI新闻/评测
- AI基础/开发

1
2
3
4