首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台
行动起来,活在当下
累计撰写
4947
篇文章
累计创建
1791
个标签
累计收到
0
条评论
栏目
首页
AI内容归档
AI新闻/评测
AI基础/开发
AI工具应用
AI创意设计
AI行业应用
AI行业应用
AI相关教程
CG资源/教程
在线AI工具
全网AI资源导航
青云聚合API
注册送免费额度
300+大模型列表
详细的教程文档
关于青云TOP
目 录
CONTENT
以下是
思维链提示
相关的文章
2026-01-29
提升“氛围编程”效率的7大热门代码套餐对比
2026-01-29
0
0
0
AI工具应用
AI基础/开发
2026-01-24
深入解析 Codex 代理循环
本文是OpenAI关于Codex工作的系列深入解析的第一篇,重点揭示了其核心的“代理循环”(agent loop)机制。我们将了解Codex CLI如何编排用户、模型和工具之间的交互,详细阐述了提示词构建、工具调用以及多轮对话管理的关键设计决策,帮助用户理解这个世界级软件代理的底层逻辑。
2026-01-24
1
0
0
AI工具应用
AI基础/开发
AI新闻/评测
2026-01-21
评估思维链的可监控性
本文介绍了OpenAI关于AI思维链(CoT)可监控性的研究框架和评估体系。研究系统性地探讨了思维链的可监控性如何随着推理时间、强化学习规模和预训练力度的变化而演变。核心发现表明,监控思维链通常比仅监控最终输出更有效,并探讨了如何通过后续问题等方式进一步增强可监控性,以实现未来AI系统的可扩展控制。
2026-01-21
0
0
0
AI新闻/评测
AI基础/开发
2026-01-12
研究人员将大型语言模型视为外星生物:揭示其内在秘密
研究人员正开创新的技术,将大型语言模型(LLM)视为复杂的生命体而非传统计算机程序进行研究。通过“机制可解释性”和“思维链监控”等方法,科学家们正试图揭示这些城市规模的“异形”机器内部的运行机制、能力边界及其怪异行为的根源,以便更好地理解和控制这项颠覆性技术。
2026-01-12
0
0
0
AI新闻/评测
AI基础/开发
2026-01-08
评估思维链的可监控性
当AI系统做出难以直接监督的决策时,理解其内部决策过程至关重要。本文介绍了OpenAI对思维链(CoT)可监控性的系统评估框架,研究了其如何随推理时间、强化学习和预训练规模的变化而演变。研究发现,大多数前沿推理模型的可监控性较高,且监控CoT通常比仅监控最终输出更有效。文章探讨了“可监控性成本”,并强调了CoT监控在确保未来AI系统安全部署中的关键作用。
2026-01-08
0
0
0
AI新闻/评测
AI基础/开发
2026-01-06
英伟达发布Alpamayo:实现像人类一样思考的开源AI模型,赋能自动驾驶
在CES 2026上,英伟达推出了Alpamayo系列开源AI模型、仿真工具和数据集,旨在提升自动驾驶汽车在复杂场景中的推理能力。核心的Alpamayo 1是一个100亿参数的思维链(Chain-of-Thought)VLA模型,能让自动驾驶系统像人类一样进行思考和决策,尤其在处理罕见或复杂情况时表现出色。
2026-01-06
0
0
0
AI新闻/评测
AI工具应用
AI行业应用
2025-12-24
超越思维链:在Amazon Bedrock上使用草稿链(Chain-of-Draft)
本文深入探讨了“草稿链”(Chain-of-Draft, CoD)这一创新的提示词技术,旨在解决生成式AI部署中质量、成本和延迟的平衡难题。CoD借鉴了人类解决问题的模式,通过限制每一步推理的词数(最多5个词),显著减少了代币使用量(最高达75%)和延迟(最高达78%),同时保持了与传统思维链(CoT)相当的准确性。我们展示了如何在Amazon Bedrock和AWS Lambda上实现CoD,为优化LLM推理成本提供了一条高效的路径。
2025-12-24
0
0
0
AI新闻/评测
AI工具应用
2025-12-19
评估思维链的可观测性
本文介绍了评估大型语言模型思维链(Chain-of-Thought, CoT)可观测性的新框架和13项评估。研究发现,CoT监控比仅监控动作和输出来得更有效,并且随着推理时“思考”的增加而提高。文章还探讨了如何通过增加推理计算量和采用后续提问策略来优化可观测性,强调其在未来AI系统安全部署中的关键作用。
2025-12-19
0
0
0
AI新闻/评测
AI基础/开发
2025-12-19
评估思维链的可监控性
随着AI系统决策复杂性的增加,理解其内部决策过程变得至关重要。OpenAI介绍了评估AI思维链(Chain-of-Thought, CoT)“可监控性”的框架和13项新评估,以系统性地衡量模型在不同推理计算量、强化学习和预训练规模下的可控性。研究发现,监控CoT远比仅监控最终输出更有效,并探讨了推理计算与模型规模之间的权衡。
2025-12-19
0
0
0
AI新闻/评测
AI基础/开发
2025-11-19
不再只是聊天:微软 Azure Copilot 获智能体加持,可 AI 自主执行云端任务
微软在 Ignite 2025 大会上宣布为 Azure Copilot 引入重磅的智能体(Agents)功能,标志着其从对话式 AI 助手升级为能够自主执行端到端云管理任务的智能平台。此次更新的核心是六款专用智能体,涵盖了从应用现代化到故障排查的多个场景,它们可以直接集成在 Azure 门户、PowerShell 和 CLI 中。新功能引入了“运营中心”和“智能体模式”,后者支持多步骤“思维链”推理,并在执行变更前需用户明确批准,确保了AI操作的透明与安全。
2025-11-19
0
0
0
AI工具应用
AI基础/开发
2025-11-16
关于如何使用ChatGPT的实用技巧和窍门
2025-11-16
0
0
0
AI工具应用
AI基础/开发
2025-11-13
使用 LangGraph 构建 ReAct 代理初学者指南
2025-11-13
1
0
0
AI基础/开发
AI工具应用
2025-11-12
隆重推出 gpt-oss-safeguard:支持自定义安全策略的开放安全推理模型
OpenAI 发布了 gpt-oss-safeguard 研究预览版,包括 1200 亿和 200 亿参数版本。该模型是 gpt-oss 的微调版,采用 Apache 2.0 许可证,允许开发者通过推理直接应用自定义安全策略。它利用思维链技术提供可解释的决策逻辑,帮助开发者根据特定应用场景(如识别作弊或虚假评论)灵活地制定和迭代安全策略,提升系统级安全性。
2025-11-12
0
0
0
AI新闻/评测
AI基础/开发
AI工具应用
2025-11-04
缓解大型语言模型(LLM)幻觉的7个提示工程技巧
2025-11-04
0
0
0
AI基础/开发
AI工具应用