把当前 1 到 13 篇 RAG 笔记重排成一条更适合学习的路径:先搭基础管线,再进入检索优化、查询优化与评估。
这组文章来自我当前阶段对 RAG 的连续学习记录。和只查某个 API 或某个库的文档不同,RAG 更像一条系统链路:从数据进入,到分块、嵌入、索引、检索、查询优化,再到评估与迭代,环节之间的因果关系很强。
所以这一组我没有按"工具名"来组织,而是按"理解系统"的顺序来收:
-
RAG 入门:概念、优势与演进路线先回答最基础的问题:RAG 到底在解决什么,为什么很多时候它比微调更合适,以及 Naive / Advanced / Modular RAG 的演进路线是什么。 -
RAG 数据加载:文档解析与预处理入口当我们说"把知识接进系统"时,第一步到底在做什么。这里主要看文档加载器、非结构化数据解析,以及为什么加载质量会直接影响后面的检索效果。 -
RAG 文本分块:为什么切、怎么切、怎么权衡分块是 RAG 最容易看轻、但最影响效果的环节之一。这里把块大小、重叠、递归分块、语义分块、结构化分块等策略整理到一起。 -
RAG 索引基础:向量嵌入、相似度与向量数据库从"文本为什么能变成向量"讲起,再进入相似度度量和向量数据库的角色,把检索层的基础心智搭起来。 -
Milvus 入门:集合、索引与检索流程当基础概念清楚之后,再具体进入 Milvus,理解 collection、schema、index、search 等真正搭系统时会用到的对象。 -
Milvus 多模态实践:图文嵌入到检索闭环最后回到一条更接近实战的路径,用多模态样例把"编码 -> 入库 -> 建索引 -> 查询 -> 可视化"串起来。 -
Naive-RAG 端到端实战把前面学过的加载、分块、嵌入、Milvus 检索和 FastAPI 串起来,先做一个最小但完整的 RAG demo,重点关注 grounded answer、评估指标和可部署性。 -
RAG 索引优化:上下文拓展与结构化索引开始从"能跑"进入"怎么跑得更合理"。这一篇讨论索引层的两个关键思路:检索粒度与生成粒度不必相同,以及知识库变大后如何借助 metadata 做结构化过滤与路由。 -
RAG 混合检索:稀疏、密集与 Milvus 实现把 dense / sparse 两条检索线放到同一张图里理解,再进入 RRF 与线性加权的差别,以及 Milvus 中如何落地双路召回。 -
RAG 查询构建:从元数据过滤到 Text2SQL当知识源不只是自由文本,查询本身也要升级。这里主要看自然语言如何转成 metadata filter、Cypher 或 SQL。 -
RAG 查询翻译:重写、分解与路由继续往前推进到 query optimization:原始问题未必是最优检索输入,所以要学会重写、拆分、HyDE 和查询路由。 -
RAG 检索进阶:重排、压缩与校正进入生产感更强的一层:初步召回以后,怎么通过 rerank、compression 和 corrective retrieval 控制最终送给模型的上下文质量。 -
RAG 评估:指标、工作流与工具最后收口到评估:先评检索,再评响应,再谈 RAGAS、Phoenix 等工具。这样系统效果变差时,才知道该改哪一段。
这条路线的目的不是把 RAG 讲成一个"背术语的模块集合",而是尽量把它还原成一条完整的数据与检索管线。正文我尽量保留了原始笔记,只做了这几类整理:
- 调整了文章顺序与命名
- 补了系列 frontmatter 和少量导读
- 统一了图片资源路径,让它能直接进入博客文集
如果你是第一次系统啃 RAG,建议就按这里的顺序往下读。
专题阅读
RAG
这篇文章属于同一条阅读链。你可以直接在这里切换,不用再回到列表页重新找。
部分信息可能已经过时