单页知识地图 / Agent 技术 / 学习路线

用一张单页地图, 看清 Agent 该先学什么。

这版不是普通资料列表,而是一个更像“学习路线图”的单页站点。 你可以先看全局,再按模块逐步深入:从 Agent 基本结构, 到 Tool Use、RAG、Memory、Multi-Agent、评测与项目落地, 让学习顺序、知识关系和实践方向一次看清。

1 张图
先建立整体认知框架
4 阶段
入门、模块、系统、落地
可复习
适合反复回看和补空白
当前主题

从 Prompt 到 Tool Use,再到 Multi-Agent 路线图

适合刚开始接触 Agent,或者已经零散学过一些内容但还没形成整体知识结构的学习者。

进入路线地图

先知道每个模块在整条链路里的位置,再决定应该先补哪一块。

路线图 + 模块图 + 实战入口 不是堆资料,而是整理学习顺序。

这个站点做什么

把“Agent 到底怎么学”做成一张可浏览、可复习、可扩展的知识地图。

不是简单堆链接,也不是复制一堆术语。 这里更重视模块之间的先后关系:哪些是入门概念,哪些是中段能力,哪些和项目落地直接相关。

知识地图

一张单页路线图,先看清 Agent 学习的四个阶段

阶段 01

建立认知

先理解 Agent 是什么、为什么需要规划、工具、状态与反馈循环。

LLM Prompt Context
  • 先区分 Chatbot、Workflow 与 Agent 的边界
  • 理解 ReAct、Plan-and-Execute 这类基本思路
  • 建立“模型不是系统本身”的基础认知
阶段 02

掌握模块

逐个理解 Tool Use、RAG、Memory、Browser Use、Code Execution 等核心能力模块。

Tools RAG Memory
  • 理解 Function Calling 与外部 API 调用机制
  • 区分短期记忆、长期记忆与检索增强的角色
  • 知道 Browser、Code、Search 各自适用场景
阶段 03

理解系统

开始思考单 Agent、工作流编排、多 Agent 协作、权限控制与失败处理。

Workflow Multi-Agent Guardrails
  • 理解 Planner、Executor、Reviewer 的常见分工
  • 学习重试、人工确认、权限控制等安全机制
  • 明确什么时候该用单 Agent,什么时候该拆流程
阶段 04

进入实践

围绕真实场景做 Demo、做评测、做复盘,把学习结果变成自己的项目经验。

Eval Demo Iteration
  • 先做小 Demo,再进入长链路自动化任务
  • 记录失败样本,逐步建立自己的评测集
  • 从结果质量、成本、耗时三个维度复盘

核心模块

沿着地图往下看,最值得拆开理解的 3 个核心模块

01

基础概念与架构

这一层决定你是不是“真的理解 Agent”。重点不是背定义,而是理解控制循环、任务拆分与上下文边界。

  • Agent 基本定义
  • 规划与执行结构
  • 状态、记忆与上下文
建议学习条目

先补 `ReAct`、`Plan-and-Execute`、上下文窗口限制、状态管理和任务分解这几个关键词。

02

工具链与工作流

这一层决定 Agent 能不能真正完成任务。需要理解工具边界、调用时机、失败回退和人工介入点。

  • Tool Use 模式
  • 工作流编排思路
  • 单 Agent 与多 Agent 区别
建议学习条目

重点看 Function Calling、RAG、Browser Use、Code Execution、人工确认节点和失败回退策略。

03

项目实践与评测

这一层决定你能不能把知识变成系统。核心不是“跑起来”,而是可观察、可复现、可迭代优化。

  • 应用场景拆解
  • 评测指标与观察方法
  • 迭代优化思路
建议学习条目

练习定义成功标准、记录失败案例、设计测试样本,并观察成本、延迟与正确率的平衡。

地图重点

如果时间有限,优先把这 3 条主线学透

主线一 认知

Agent 控制循环

理解“观察 - 判断 - 规划 - 执行 - 再观察”的核心闭环,很多后续模块其实都是在补强这个循环。

ReAct Planning Feedback Loop
主线二 能力

Tool Use 与记忆系统

搞懂 Agent 为什么要借助外部工具和外部记忆,才能真正突破“只靠一次回答”的能力上限。

Function Calling RAG Memory
主线三 工程

多 Agent 与评测体系

知道如何拆角色只是开始,更重要的是定义成功标准、记录失败模式,并让系统可以持续改进。

Planner Reviewer Eval

推荐资源

如果你想直接开始学,可以先从这些文章、论文和框架文档切入

再看官方文档

框架对比

如果你准备真正上手,OpenAI Agents SDK、LangGraph、AutoGen 可以这样理解

OpenAI

Agents SDK

更适合想快速搭起现代 Agent 应用的开发者。官方文档强调工具调用、agent handoff、流式输出和完整 trace。

  • 适合谁:想尽快做出可运行 Agent 原型的人
  • 长处:工具调用清晰,handoff 与 tracing 直接可用
  • 学习重点:Tools、Handoffs、Guardrails、Tracing
  • 适合场景:单 Agent 到轻量多 Agent 应用
看官方文档
LangChain

LangGraph

更适合需要自己掌控状态流转和长流程编排的人。官方定位非常明确:这是一个偏底层、面向编排的状态化 Agent 框架。

  • 适合谁:想自己定义执行图和节点状态的开发者
  • 长处:durable execution、human-in-the-loop、memory
  • 学习重点:StateGraph、节点、边、状态持久化
  • 适合场景:长链路、可恢复、可人工介入的工作流
看官方文档
Microsoft

AutoGen

更适合把多 Agent 协作当成重点来学的人。官方文档里 `AgentChat` 是推荐起点,`Core` 则保留了更强的事件驱动灵活性。

  • 适合谁:想重点研究多 Agent 角色协作与团队模式的人
  • 长处:高层多 Agent API + 更底层 Core 分层清晰
  • 学习重点:AgentChat、Teams、GraphFlow、Core
  • 适合场景:角色拆分明显、协作链路复杂的系统
看官方文档

一句话怎么选

想先跑通现代 Agent 能力

先看 OpenAI Agents SDK,更容易快速理解 tools、handoff 和 trace 这些关键能力。

想掌控复杂工作流与状态

优先学 LangGraph,它更像 Agent 编排层,适合长期、可恢复、可控的流程系统。

想重点研究多 Agent 协作

优先学 AutoGen,尤其适合把多角色分工、团队通信和协作策略当成主线来学。

建议顺序

如果你照着这页学习,推荐按这个顺序往下走

01

先看全局地图

先把整体结构看一遍,知道 Agent 由哪些部分组成,以及每个模块在系统里处于什么位置。

02

再拆关键模块

优先学习 Tool Use、RAG、Memory、Workflow,把最常见的工程组件先理解清楚。

03

然后做小型 Demo

从检索问答、网页操作、文档总结这类任务入手,让每一个模块都对应一次具体实践。

04

最后建立评测思维

把“好不好用”变成可观察的标准,记录失败案例和调优过程,逐渐形成自己的工程判断力。

如何使用

把它当成一张路标页:先定位自己在哪,再决定下一步补哪块。

如果你是刚入门,可以从知识地图和建议顺序开始; 如果你已经学过一些框架,就重点看核心模块和地图重点; 如果你已经在做项目,就把这页当成复盘清单,看哪些能力还没真正补齐。

后续扩展

如果继续往下做,这张单页地图最适合扩展成一个真正可更新的 Agent 知识站。

比如在每个模块下面继续接文章、论文、框架对比、实践案例和常见误区, 让这张地图从“看结构”进一步变成“点进去就能继续学”。