908 字
2 分钟
RAGrag
RAG 学习路线图:从基础管线到进阶检索与评估

把当前 1 到 13 篇 RAG 笔记重排成一条更适合学习的路径:先搭基础管线,再进入检索优化、查询优化与评估。

这组文章来自我当前阶段对 RAG 的连续学习记录。和只查某个 API 或某个库的文档不同,RAG 更像一条系统链路:从数据进入,到分块、嵌入、索引、检索、查询优化,再到评估与迭代,环节之间的因果关系很强。

所以这一组我没有按"工具名"来组织,而是按"理解系统"的顺序来收:

  1. RAG 入门:概念、优势与演进路线 先回答最基础的问题:RAG 到底在解决什么,为什么很多时候它比微调更合适,以及 Naive / Advanced / Modular RAG 的演进路线是什么。

  2. RAG 数据加载:文档解析与预处理入口 当我们说"把知识接进系统"时,第一步到底在做什么。这里主要看文档加载器、非结构化数据解析,以及为什么加载质量会直接影响后面的检索效果。

  3. RAG 文本分块:为什么切、怎么切、怎么权衡 分块是 RAG 最容易看轻、但最影响效果的环节之一。这里把块大小、重叠、递归分块、语义分块、结构化分块等策略整理到一起。

  4. RAG 索引基础:向量嵌入、相似度与向量数据库 从"文本为什么能变成向量"讲起,再进入相似度度量和向量数据库的角色,把检索层的基础心智搭起来。

  5. Milvus 入门:集合、索引与检索流程 当基础概念清楚之后,再具体进入 Milvus,理解 collection、schema、index、search 等真正搭系统时会用到的对象。

  6. Milvus 多模态实践:图文嵌入到检索闭环 最后回到一条更接近实战的路径,用多模态样例把"编码 -> 入库 -> 建索引 -> 查询 -> 可视化"串起来。

  7. Naive-RAG 端到端实战 把前面学过的加载、分块、嵌入、Milvus 检索和 FastAPI 串起来,先做一个最小但完整的 RAG demo,重点关注 grounded answer、评估指标和可部署性。

  8. RAG 索引优化:上下文拓展与结构化索引 开始从"能跑"进入"怎么跑得更合理"。这一篇讨论索引层的两个关键思路:检索粒度与生成粒度不必相同,以及知识库变大后如何借助 metadata 做结构化过滤与路由。

  9. RAG 混合检索:稀疏、密集与 Milvus 实现 把 dense / sparse 两条检索线放到同一张图里理解,再进入 RRF 与线性加权的差别,以及 Milvus 中如何落地双路召回。

  10. RAG 查询构建:从元数据过滤到 Text2SQL 当知识源不只是自由文本,查询本身也要升级。这里主要看自然语言如何转成 metadata filter、Cypher 或 SQL。

  11. RAG 查询翻译:重写、分解与路由 继续往前推进到 query optimization:原始问题未必是最优检索输入,所以要学会重写、拆分、HyDE 和查询路由。

  12. RAG 检索进阶:重排、压缩与校正 进入生产感更强的一层:初步召回以后,怎么通过 rerank、compression 和 corrective retrieval 控制最终送给模型的上下文质量。

  13. RAG 评估:指标、工作流与工具 最后收口到评估:先评检索,再评响应,再谈 RAGAS、Phoenix 等工具。这样系统效果变差时,才知道该改哪一段。

这条路线的目的不是把 RAG 讲成一个"背术语的模块集合",而是尽量把它还原成一条完整的数据与检索管线。正文我尽量保留了原始笔记,只做了这几类整理:

  • 调整了文章顺序与命名
  • 补了系列 frontmatter 和少量导读
  • 统一了图片资源路径,让它能直接进入博客文集

如果你是第一次系统啃 RAG,建议就按这里的顺序往下读。

专题阅读

RAG

这篇文章属于同一条阅读链。你可以直接在这里切换,不用再回到列表页重新找。

当前进度1 / 14