这个站点做什么
单页知识地图 / Agent 技术 / 学习路线
用一张单页地图, 看清 Agent 该先学什么。
这版不是普通资料列表,而是一个更像“学习路线图”的单页站点。 你可以先看全局,再按模块逐步深入:从 Agent 基本结构, 到 Tool Use、RAG、Memory、Multi-Agent、评测与项目落地, 让学习顺序、知识关系和实践方向一次看清。
- 1 张图
- 先建立整体认知框架
- 4 阶段
- 入门、模块、系统、落地
- 可复习
- 适合反复回看和补空白
先知道每个模块在整条链路里的位置,再决定应该先补哪一块。
不是简单堆链接,也不是复制一堆术语。 这里更重视模块之间的先后关系:哪些是入门概念,哪些是中段能力,哪些和项目落地直接相关。
知识地图
一张单页路线图,先看清 Agent 学习的四个阶段
建立认知
先理解 Agent 是什么、为什么需要规划、工具、状态与反馈循环。
- 先区分 Chatbot、Workflow 与 Agent 的边界
- 理解 ReAct、Plan-and-Execute 这类基本思路
- 建立“模型不是系统本身”的基础认知
掌握模块
逐个理解 Tool Use、RAG、Memory、Browser Use、Code Execution 等核心能力模块。
- 理解 Function Calling 与外部 API 调用机制
- 区分短期记忆、长期记忆与检索增强的角色
- 知道 Browser、Code、Search 各自适用场景
理解系统
开始思考单 Agent、工作流编排、多 Agent 协作、权限控制与失败处理。
- 理解 Planner、Executor、Reviewer 的常见分工
- 学习重试、人工确认、权限控制等安全机制
- 明确什么时候该用单 Agent,什么时候该拆流程
进入实践
围绕真实场景做 Demo、做评测、做复盘,把学习结果变成自己的项目经验。
- 先做小 Demo,再进入长链路自动化任务
- 记录失败样本,逐步建立自己的评测集
- 从结果质量、成本、耗时三个维度复盘
核心模块
沿着地图往下看,最值得拆开理解的 3 个核心模块
基础概念与架构
这一层决定你是不是“真的理解 Agent”。重点不是背定义,而是理解控制循环、任务拆分与上下文边界。
- Agent 基本定义
- 规划与执行结构
- 状态、记忆与上下文
先补 `ReAct`、`Plan-and-Execute`、上下文窗口限制、状态管理和任务分解这几个关键词。
工具链与工作流
这一层决定 Agent 能不能真正完成任务。需要理解工具边界、调用时机、失败回退和人工介入点。
- Tool Use 模式
- 工作流编排思路
- 单 Agent 与多 Agent 区别
重点看 Function Calling、RAG、Browser Use、Code Execution、人工确认节点和失败回退策略。
项目实践与评测
这一层决定你能不能把知识变成系统。核心不是“跑起来”,而是可观察、可复现、可迭代优化。
- 应用场景拆解
- 评测指标与观察方法
- 迭代优化思路
练习定义成功标准、记录失败案例、设计测试样本,并观察成本、延迟与正确率的平衡。
地图重点
如果时间有限,优先把这 3 条主线学透
Agent 控制循环
理解“观察 - 判断 - 规划 - 执行 - 再观察”的核心闭环,很多后续模块其实都是在补强这个循环。
Tool Use 与记忆系统
搞懂 Agent 为什么要借助外部工具和外部记忆,才能真正突破“只靠一次回答”的能力上限。
多 Agent 与评测体系
知道如何拆角色只是开始,更重要的是定义成功标准、记录失败模式,并让系统可以持续改进。
推荐资源
如果你想直接开始学,可以先从这些文章、论文和框架文档切入
先读这些论文
- ReAct: Synergizing Reasoning and Acting in Language Models 适合先理解 Agent 为什么不是单次问答,而是“推理 + 行动”的循环。
- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 适合建立 RAG 的基础认知,理解外部知识检索为什么重要。
- Generative Agents: Interactive Simulacra of Human Behavior 适合理解记忆、反思、规划这些模块为什么会影响 Agent 行为。
再看官方文档
- OpenAI Agents SDK 适合看工具调用、handoff、guardrails 和 tracing 这些现代 Agent 工程能力。
- LangGraph Overview 适合理解状态化 Agent、长流程编排、人类介入和可控执行。
- AutoGen Stable Docs 适合学习单 Agent、多 Agent 和事件驱动式协作框架。
最后补工程主题
- LangGraph Memory Overview 适合补短期记忆、长期记忆、线程状态和跨会话信息存储。
- AutoGen Core 适合往分布式、多角色、事件驱动和可扩展系统方向继续深入。
- OpenAI: New tools for building agents 适合从产品视角理解 Agent 平台需要哪些基础构件和观测能力。
框架对比
如果你准备真正上手,OpenAI Agents SDK、LangGraph、AutoGen 可以这样理解
Agents SDK
更适合想快速搭起现代 Agent 应用的开发者。官方文档强调工具调用、agent handoff、流式输出和完整 trace。
- 适合谁:想尽快做出可运行 Agent 原型的人
- 长处:工具调用清晰,handoff 与 tracing 直接可用
- 学习重点:Tools、Handoffs、Guardrails、Tracing
- 适合场景:单 Agent 到轻量多 Agent 应用
LangGraph
更适合需要自己掌控状态流转和长流程编排的人。官方定位非常明确:这是一个偏底层、面向编排的状态化 Agent 框架。
- 适合谁:想自己定义执行图和节点状态的开发者
- 长处:durable execution、human-in-the-loop、memory
- 学习重点:StateGraph、节点、边、状态持久化
- 适合场景:长链路、可恢复、可人工介入的工作流
AutoGen
更适合把多 Agent 协作当成重点来学的人。官方文档里 `AgentChat` 是推荐起点,`Core` 则保留了更强的事件驱动灵活性。
- 适合谁:想重点研究多 Agent 角色协作与团队模式的人
- 长处:高层多 Agent API + 更底层 Core 分层清晰
- 学习重点:AgentChat、Teams、GraphFlow、Core
- 适合场景:角色拆分明显、协作链路复杂的系统
一句话怎么选
先看 OpenAI Agents SDK,更容易快速理解 tools、handoff 和 trace 这些关键能力。
优先学 LangGraph,它更像 Agent 编排层,适合长期、可恢复、可控的流程系统。
优先学 AutoGen,尤其适合把多角色分工、团队通信和协作策略当成主线来学。
建议顺序
如果你照着这页学习,推荐按这个顺序往下走
先看全局地图
先把整体结构看一遍,知道 Agent 由哪些部分组成,以及每个模块在系统里处于什么位置。
再拆关键模块
优先学习 Tool Use、RAG、Memory、Workflow,把最常见的工程组件先理解清楚。
然后做小型 Demo
从检索问答、网页操作、文档总结这类任务入手,让每一个模块都对应一次具体实践。
最后建立评测思维
把“好不好用”变成可观察的标准,记录失败案例和调优过程,逐渐形成自己的工程判断力。
如何使用
把它当成一张路标页:先定位自己在哪,再决定下一步补哪块。
如果你是刚入门,可以从知识地图和建议顺序开始; 如果你已经学过一些框架,就重点看核心模块和地图重点; 如果你已经在做项目,就把这页当成复盘清单,看哪些能力还没真正补齐。