吴恩达深度解读Agentic AI：手把手教你搭建Agent工作流，让GPT-3.5反超GPT-4不再是梦想-青云TOP

📢 转载信息

原文链接：https://www.qbitai.com/2025/10/340687.html

原文作者：henry

量子位 | 公众号 QbitAI

henry 发自凹非寺
量子位 | 公众号 QbitAI

吴恩达（Andrew Ng）又推出重磅新课了，这次的主题是——Agentic AI。

在这门新课中，吴恩达将Agentic工作流的开发精髓总结为四大核心设计模式：反思（Reflection）、工具调用（Tool use）、规划（Planning）与协作（Collaboration）。他首次强调，在智能体（Agent）开发中，评估与误差分析才是决定性的能力：

谁能建立起系统化的评估与误差分析流程，持续定位并改进智能体工作流中的问题，谁就在智能体开发中领先一步。

在课程演示中，吴恩达展示了如何通过应用Agentic技巧，让GPT-3.5在编程任务中轻松超越GPT-4。

Agentic AI的核心思想是：不再让模型一次性“憋”出答案，而是教会模型像人类一样拆解任务、反思结果、使用工具修正偏差，并在多轮循环中不断优化。

这种更贴近人类工作流的方式，使其性能远超传统的端到端Agent。

想知道如何做到这一点？来跟随吴恩达的课程一探究竟吧！

Agentic AI：从“调模型”到“设计系统”

首先需要明确的是，这门新课与其说是一个技术教程，不如说是一门揭示Agentic AI背后系统性方法论的课程。

课程的重点不在于堆砌工作流界面，而在于如何让AI像人类一样，通过分解、执行与优化来解决复杂问题。

其中，任务分解既是构建Agentic工作流的起点，也是持续改进和优化的前提。

例如，我们在写论文时，会先设计提纲，然后查找资料、撰写初稿、反复修改。AI也需要这样的结构化过程。写作任务本身就由多个子任务衔接而成。

Agentic的核心理念正是让大语言模型通过多步推理与分阶段执行来工作，而不是一次性生成结果。

如何拆解复杂任务？

吴恩达指出，他通常会先分析现有流程，将其拆解为离散步骤，并思考哪些步骤可以通过调用API或工具由大模型实现。如果模型暂时无法完成某一步，就继续细化任务，直到可以落地实现。

获得初始工作流后，关键在于评估与改进：分析系统性能、定位薄弱环节，并不断优化迭代。这种以“分解—执行—评估—优化”为核心的循环，正是Agentic的本质和本次课程的重点。

吴恩达提出的四大Agentic设计模式

1. Reflection（反思）

反思的核心思想很简单：让大模型审视自己的输出结果，并思考如何改进。

例如，可以让模型先输出一段代码，然后将测试结果反馈给它，让它基于反馈进行修改。

吴恩达分享了利用反思方法的经验：

可以尝试让两个模型“左右互搏”，让具备推理能力（Reasoning）的模型进行反思，通常效果更佳。
在难以凭直觉判断输出优劣时，可以设定客观的量化评分机制（如二元打分），让大模型根据评分计算结果进行评估。
若能获取外部反馈（如参考答案或正确内容），模型自我修正的效果通常远超仅依赖自身反思。

2. 工具调用（Tool Use）

工具调用指的是由大语言模型驱动的应用能够自主决定调用哪些外部功能，例如进行网页搜索、访问日历、发送邮件或编写代码等。

吴恩达对比了传统的工具调用流程和当前流行的MCP（Model-Client-Protocol）方法。

传统流程中，开发者需要预先集成工具，模型通过特定输出提示开发者调用函数，再将结果反馈给模型，这更像是开发者在主动调用工具。

理想的方式是让大模型自主生成、调用和匹配工具。为此，可以使用吴恩达团队开发的AISuite开源库，或采用Anthropic提出的MCP等“统一协议”/“抽象层”。

MCP将散乱的工具调用转变为“标准客户端-服务器模式”，AI只需像调用本地函数一样调用服务端即可，极大地简化了智能体工具调用的流程。

需要注意的是，让模型自行编写和调用代码存在风险，建议在沙盒环境（如 Docker 或 e2b）中进行操作。

3. 规划（Planning）

如果每次遇到请求都临时添加工具，效率低下且难以形成可复用流程。规划（Planning）使大模型能够根据不同请求，灵活调整工具序列的执行顺序，优化性能和资源使用。

吴恩达分享了一个实用技巧：将执行步骤转化为JSON或代码形式，使任务离散化，模型可严格按步骤执行。这显著提升了Agent的任务执行表现，并为后续评估优化提供了清晰的轨迹。

4. 多智能体协作（Multi-agent Collaboration）

多智能体协作是指构建多个具备不同专长的智能体共同完成复杂任务，如同公司雇佣多名员工各司其职。这类似于计算机中的多线程，允许开发者专注于优化单个组件，其他智能体并行处理任务，最后整合结果，提升整体效率。

大语言模型不仅可以调用工具，还可以调用其他智能体，实现不同层级的嵌套调用。这种结构化协作方式提升了工作流的可扩展性和可维护性。

构建Agentic的实用技巧：迭代反馈循环

每一步Agentic工作流的构建，都可以看作是一个闭环迭代反馈，类似于强化学习中的“采样-评估-改进”循环：

Build / Sampling（采样）：搭建系统或工作流，让模型在不同任务上尝试执行并收集结果。
Evaluation/Analyze（评估）：分析输出结果，进行端到端和组件级别的精细评估，快速定位错误来源。
Improvement（改进）：根据评估结果优化流程或组件（调整参数、替换模块、改进提示词或拆分步骤），进入下一轮循环。

通过这种循环，Agentic AI不断迭代升级，其“策略”即是工作流和组件设计，通过四大模式实现高效、持续进化的AI系统。

聚焦错误评估与改进

错误评估包括端到端评估和组件级别评估。组件级别评估能更快定位具体错误环节，集中精力改进系统。

错误是指某一步输出结果明显低于人类专家的表现。通过追踪中间执行轨迹可以定位问题（例如，是模型调用搜索工具出错了，还是PDF转文档模块有问题）。评估可依赖人工或借助AI加速（如创建可信源清单）。

通过组件级评估，可以针对性地优化：调整组件参数（如RAG搜索范围）、替换组件（函数或工具）、改进大模型组件（优化提示词、尝试不同模型、拆分流程或微调）。

在更换或选择大模型组件时，吴恩达的实践直觉是：多尝试不同模型、参考他人提示词设计、并将不同模型应用于工作流观察表现，从而不断迭代提升系统可靠性与效率。

以上是对吴恩达Agentic AI课程的梳理，课程全集可在Deeplearning.AI上订阅收听。

为什么是Agentic而不是Agent？

早在去年初，吴恩达就提出，Agentic作为一个形容词，而非二元分类，用于描述系统在自主性（智能体特性）上的不同程度。这有助于理解系统在智能体能力上的连续性。

在本次课程中，他进一步深化了理解：Agentic AI指的是一个基于LLM的应用程序执行多个步骤来完成一项任务。

与传统端到端Agent（用户一个Prompt，模型一个输出）不同，Agentic AI通过将任务拆分为多个步骤，每一步都经过处理和优化，这更符合人类的工作方式，也显著优于一次性输出答案的Agent（这也是GPT-3.5能战胜GPT-4的原因）。

因此，学习如何将复杂任务分解为步骤并构建高效执行每一步的组件，是构建高效代理型工作流的关键技能。

对于端到端的Agent，开发者优化空间有限，只能依赖Prompt优化或模型本身升级。而通过拆分组件、逐步优化，Agentic AI使得每个环节都可迭代改进，系统得以持续进化。

值得一提的是，Agentic最初是吴恩达用来描述快速增长的趋势，但很快被市场营销人员用作炒作标签。尽管如此，Agentic方法论在实际应用中仍具有巨大价值，为开发者提供了可落地、可优化的路径。

目前，除了成熟的代码Agent，基于步骤的Agentic AI仍有广阔的发展空间，为探索更复杂、更智能的多步骤工作流提供了机会。

参考链接

[1]https://x.com/AndrewYNg/status/1975614372799283423

[2]https://www.deeplearning.ai/courses/Agentic-ai/

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，小白也可以简单操作。

青云聚合API官网https://api.qingyuntop.top

支持全球最新300+模型：https://api.qingyuntop.top/pricing

详细的调用教程及文档：https://api.qingyuntop.top/about

目录CONTENT

吴恩达深度解读Agentic AI：手把手教你搭建Agent工作流，让GPT-3.5反超GPT-4不再是梦想