3.RAG的基础 – Heaven.Blog

3. RAG

现阶段，FastGPT的知识库集成做的最为优秀，利用多种优化结合RAG模型实现了其中的知识搜索和文本生成。

那么既然其这么强，且在官网上进行了详细介绍RAG，那么我们就总结一下

RAG是将两种模型结合的混合架构，分别为检索模型和生成模型

检索模型从知识库获取到和用户输入相关的内容片段传递给生成器，生成器作为文本生成模型会基于这些检索内容生成自然语言输出。

对于检索器，主要任务是从一个外部知识库或者文档中获取到输入最相关的内容

利用了向量检索也就是将输入转换为向量，然后利用相似度来进行匹配。适用于捕捉语义性。除此外还利用了传统检索算法，利用逆文档频率来进行排序和检索。适合简单的匹配工作。

其次是生成器，也就是最终的语言输出模型。这里我们不多赘述，大家可以理解为最常见的ChatGPT，deepseek。

那么结合两者，其工作起来流程为

RAG的优势可以分为如下几点

局限性则如下

为了解决上述说的局限性，RAG提供了改进方向。

主要分为几个方向

知识库的构建，数据库分块，检索优化，回答生成优化

对于知识库的构建

1.建立特定的数据集，采用特定的具有权威的数据来源，通过跨领域数据知识库建立，从而确保跨领域回答的正确性

2.建立数据质量审查和过滤机制，结合人工审查和自动化处理两个流程，确保数据来源可信，减少数据干扰。

3.引入自动化更新，比如网络爬虫等，将新的文档筛选后加入到之前的知识库，让知识更具有时效性。

4.建立合理的分段流程，一方面是算法去重，另一方面是引入后置重处理确保数据准确性。

5.优化数据储存格式，确保数据格式一致，使用JSON等结构化形式存储数据，便于高效查询。

6.建立用户反馈机制，通过这个反馈机制，帮助维护人员管理知识库。

对于数据分块的优化

RAG模型中数据分块和是RAG模型应用中的重要模块。如果具有合理的分块策略，那么可以在生成时提供清晰的上下文支持，反之如果分段不合理，可能要么取得的上下文是断裂的，要么是过多的，影响生成模型的速度。