首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
3557
篇文章
累计创建
1282
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
模型训练
相关的文章
2025-12-04
AWS在AWS re:Invent大会上发布新功能,旨在简化企业定制LLM的创建过程
在AWS re:Invent大会上,亚马逊云科技(AWS)宣布了Amazon Bedrock和Amazon SageMaker AI的新功能,重点是简化企业构建和微调定制化大型语言模型(LLMs)的流程。新推出的SageMaker无服务器模型定制和Bedrock中的强化微调功能,旨在降低企业创建差异化AI模型的门槛,即使在AWS尚未占据主导地位的AI模型市场中,也可能成为其竞争优势。
2025-12-04
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-12-03
人工智能安全新挑战:仅需约250份恶意文档即可识别恶意AI模型
研究人员发现,识别恶意人工智能模型的新方法远比预想的更有效率。研究表明,仅需向模型展示大约250份精心构造的恶意文档,就能成功检测出那些被植入后门的AI模型。这一发现揭示了人工智能安全防护领域的紧迫性,强调了目前主流模型防护策略的脆弱性。随着AI系统被更广泛地集成到关键基础设施中,理解和应对这些潜在威胁变得至关重要,尤其是在模型训练和部署的各个阶段。
2025-12-03
0
0
0
AI基础/开发
AI新闻/评测
2025-12-02
上下文工程是新的提示词工程
人工智能的控制前沿正从精妙的提示词措辞转向设计更具深度的环境。上下文工程通过整合数据、元数据、记忆和叙事结构,取代了易出错的提示词工程,成为构建连贯、一致AI工作流的关键。这种范式转变意味着我们不再专注于编写“魔咒”般的指令,而是通过构建稳定的基础设施,比如检索增强生成(RAG)和分层记忆系统,确保模型推理过程的准确性和持久性。上下文工程是AI可靠性的未来基石,它将AI的关系从简单的命令转变为真正的协作。
2025-12-02
0
0
0
AI基础/开发
AI工具应用
2025-12-01
如何加速语言模型的训练
语言模型训练涉及大量的计算资源和时间,本指南深入探讨了多种加速训练过程的有效策略。文章详细介绍了从硬件优化到软件配置的各个方面,包括采用混合精度训练、使用梯度累积以模拟更大的批次大小、以及实施高效的数据加载和模型并行化技术。掌握这些方法可以显著缩短模型开发周期,提高训练效率,从而加速AI创新。
2025-12-01
0
0
0
AI基础/开发
AI工具应用
2025-11-28
Transformer中的Token之旅:究竟发生了什么
2025-11-28
0
0
0
AI基础/开发
2025-11-28
Token在Transformer内部的旅程:究竟发生了什么?
2025-11-28
0
0
0
AI基础/开发
AI工具应用
2025-11-26
从零开始预训练BERT模型
2025-11-26
0
0
0
AI基础/开发
AI工具应用
2025-11-23
BERT 模型及其变体:BERT 模型及其变体的全面指南
2025-11-23
0
0
0
AI基础/开发
AI工具应用
2025-11-22
专家级特征工程:高风险模型的先进技术
2025-11-22
0
0
0
AI基础/开发
AI工具应用
2025-11-21
针对提示注入攻击的防御:StruQ 和 SecAlign
提示注入攻击是当前LLM集成应用面临的首要威胁。本文提出了两种无需额外计算成本的微调防御方法:StruQ和SecAlign。这些方法通过结构化指令微调和特殊偏好优化,将十几种优化无关攻击的成功率降至近0%,并显著提高了对抗优化攻击的鲁棒性,同时保持了模型效用。
2025-11-21
0
0
0
AI基础/开发
AI工具应用
2025-11-20
使用 Spectrum 微调技术提高 Amazon SageMaker AI 上的 FM 训练效率
本文深入介绍了 Spectrum 微调技术,这是一种通过识别和选择性训练基础模型(FM)中最具信息量的层来提高训练效率的新方法。我们将展示如何在 Amazon SageMaker AI 上实施 Spectrum 微调,并与 QLoRA 等技术进行对比,证明 Spectrum 能够在显著减少资源消耗和训练时间的同时,保持更高的模型性能。
2025-11-20
0
0
0
AI行业应用
AI基础/开发
AI工具应用
2025-11-20
使用 Spectrum 微调技术提高 Amazon SageMaker AI 上 FM 训练效率
本文详细介绍了 Spectrum 微调技术,这是一种通过识别和选择模型中最具信息量的层进行训练的方法。我们将探讨如何在 Amazon SageMaker AI 上利用 Spectrum 优化资源使用和缩短训练时间,并将其与 QLoRA 技术进行对比,展示 Spectrum 如何在资源效率和最终模型性能之间取得更好的平衡。
2025-11-20
0
0
0
AI基础/开发
AI工具应用
AI新闻/评测
2025-11-19
为 BERT 模型训练分词器
2025-11-19
0
0
0
AI基础/开发
AI工具应用
2025-11-19
Stack Overflow 正在重塑自身,转型为 AI 数据提供商
在微软 Ignite 大会上,Stack Overflow 发布了一系列新产品,旨在将其企业版产品 Stack Overflow Internal 转型为将人类专业知识转化为 AI 可访问格式的工具。新产品将提供附加元数据和可靠性评分,以更好地训练企业 AI 代理,并与 Reddit 的数据授权模式类似,通过向 AI 实验室出售数据使用权来实现收入增长。
2025-11-19
0
0
0
AI新闻/评测
AI行业应用
AI基础/开发
2025-11-14
OpenAI的新型大型语言模型揭示了AI究竟如何工作的秘密
OpenAI构建了一个实验性的大型语言模型,其透明度远超现有模型。由于当前LLM如同“黑箱”,这项研究旨在揭示其内部机制,帮助我们理解模型出现怪异行为、产生幻觉的原因,并评估其在关键任务中的可信度。
2025-11-14
0
0
0
AI新闻/评测
AI基础/开发
2025-11-14
通过稀疏电路理解神经网络
本文介绍了OpenAI研究人员通过训练更“稀疏”的神经网络,使之更易于理解的新方法。研究人员强制模型的大部分连接权重为零,从而形成更简单、可追踪的内部“电路”,这为全面理解复杂AI模型的工作机制提供了有前景的途径。
2025-11-14
0
0
0
AI新闻/评测
AI基础/开发
2025-11-13
扎克伯格战略调整逼走大佬?消息称 Meta 首席 AI 科学家杨立昆计划离职创业
图灵奖得主、Meta 首席人工智能科学家杨立昆(Yann LeCun)计划离开 Meta 创业,此举正值扎克伯格彻底改革公司 AI 战略之际。为抗衡 OpenAI 和谷歌,扎克伯格正推动 Meta 从长期基础研究转向“快速落地”,弱化了由杨立昆领导的 FAIR 部门,转而聚焦加速 AI 模型部署。据报道,杨立昆将继续专注于“世界模型”的研发,而 Meta 股价近期因 AI 支出预期高企而面临华尔街压力。此次高层变动预示着 Meta AI 战略的重大转型。
2025-11-13
0
0
0
AI新闻/评测
AI基础/开发
AI行业应用
2025-11-12
GPT-OSS-Safeguard 技术报告:GPT-OSS-Safeguard-120B 与 GPT-OSS-Safeguard-20B 的性能与基准评估
OpenAI发布了GPT-OSS-Safeguard-120B和20B模型的性能与安全基准评估技术报告。这些基于GPT-OSS的开放权重推理模型,专为内容分类和标注设计,遵循Apache 2.0许可。报告详细阐述了其功能特性,并提供了与底层GPT-OSS模型的安全基准对比,确保模型在不同推理强度和多语言场景下的表现符合预期。
2025-11-12
0
0
0
AI新闻/评测
AI基础/开发
1
2