如何理解RAG | Jin's Blog

password

Created time

Jun 15, 2025 08:23 AM

type

status

date

slug

summary

RAG的核心特征体现在其独特的工作机制和应用优势上：

动态知识整合（无需微调模型）： RAG 能够实时访问外部知识库（如企业数据库或专业文献），并在不修改LLM底层参数的情况下动态加载和更新知识，实现“热装卸”（Hot-Swapping）。这一特性省略了模型微调的成本，可快速适配不同垂直领域的需求。

减少幻觉与增强可靠性：通过检索真实外部数据，RAG 显著降低LLM的“幻觉”（Hallucination）问题，即生成虚构或错误信息。例如，在医疗场景中，RAG结合专业指南（如NCCN）可确保诊断建议的准确性。

数据隐私与安全隔离： RAG 访问的外部数据不参与LLM训练过程，仅用于检索阶段的上下文增强，有效保护敏感数据（如患者病历或企业专有信息）。这解决了通用大模型在垂直领域的数据安全顾虑。

灵活检索策略优化：支持混合检索机制（如语义向量检索、知识图谱检索），并通过算法（如重排器FlagReranker）优化Top-K结果的匹配精度。例如，使用余弦相似度计算查询与文档块的相关性，提升响应质量。

RAG 工作流程分为三步：

此框架的核心价值在于弥补LLM的三大局限：知识时效性不足、幻觉风险及数据安全挑战。