RAG 学习路线图：从基础管线到进阶检索与评估

这组文章来自我当前阶段对 RAG 的连续学习记录。和只查某个 API 或某个库的文档不同，RAG 更像一条系统链路：从数据进入，到分块、嵌入、索引、检索、查询优化，再到评估与迭代，环节之间的因果关系很强。

所以这一组我没有按"工具名"来组织，而是按"理解系统"的顺序来收：

RAG 入门：概念、优势与演进路线 先回答最基础的问题：RAG 到底在解决什么，为什么很多时候它比微调更合适，以及 Naive / Advanced / Modular RAG 的演进路线是什么。
RAG 数据加载：文档解析与预处理入口 当我们说"把知识接进系统"时，第一步到底在做什么。这里主要看文档加载器、非结构化数据解析，以及为什么加载质量会直接影响后面的检索效果。
RAG 文本分块：为什么切、怎么切、怎么权衡 分块是 RAG 最容易看轻、但最影响效果的环节之一。这里把块大小、重叠、递归分块、语义分块、结构化分块等策略整理到一起。
RAG 索引基础：向量嵌入、相似度与向量数据库 从"文本为什么能变成向量"讲起，再进入相似度度量和向量数据库的角色，把检索层的基础心智搭起来。
Milvus 入门：集合、索引与检索流程 当基础概念清楚之后，再具体进入 Milvus，理解 collection、schema、index、search 等真正搭系统时会用到的对象。
Milvus 多模态实践：图文嵌入到检索闭环 最后回到一条更接近实战的路径，用多模态样例把"编码 -> 入库 -> 建索引 -> 查询 -> 可视化"串起来。
Naive-RAG 端到端实战 把前面学过的加载、分块、嵌入、Milvus 检索和 FastAPI 串起来，先做一个最小但完整的 RAG demo，重点关注 grounded answer、评估指标和可部署性。
RAG 索引优化：上下文拓展与结构化索引 开始从"能跑"进入"怎么跑得更合理"。这一篇讨论索引层的两个关键思路：检索粒度与生成粒度不必相同，以及知识库变大后如何借助 metadata 做结构化过滤与路由。
RAG 混合检索：稀疏、密集与 Milvus 实现 把 dense / sparse 两条检索线放到同一张图里理解，再进入 RRF 与线性加权的差别，以及 Milvus 中如何落地双路召回。
RAG 查询构建：从元数据过滤到 Text2SQL 当知识源不只是自由文本，查询本身也要升级。这里主要看自然语言如何转成 metadata filter、Cypher 或 SQL。
RAG 查询翻译：重写、分解与路由 继续往前推进到 query optimization：原始问题未必是最优检索输入，所以要学会重写、拆分、HyDE 和查询路由。
RAG 检索进阶：重排、压缩与校正 进入生产感更强的一层：初步召回以后，怎么通过 rerank、compression 和 corrective retrieval 控制最终送给模型的上下文质量。
RAG 评估：指标、工作流与工具 最后收口到评估：先评检索，再评响应，再谈 RAGAS、Phoenix 等工具。这样系统效果变差时，才知道该改哪一段。

这条路线的目的不是把 RAG 讲成一个"背术语的模块集合"，而是尽量把它还原成一条完整的数据与检索管线。正文我尽量保留了原始笔记，只做了这几类整理：

调整了文章顺序与命名
补了系列 frontmatter 和少量导读
统一了图片资源路径，让它能直接进入博客文集

如果你是第一次系统啃 RAG，建议就按这里的顺序往下读。