4.FastGPT的知识库实现和调优

在FastGPT之中，我们采用了Embedding方案来构建知识库，这个Embeddeding的方案，是将文字或者图片转换为向量。然后在搜索的时候，计算不同向量之间的距离，也就是向量之间的相似度，从而得到最符合意思的大难。

因此在知识库实现中，向量的录入和搜索环节是最重要的。

在FastGPT之中，其将文本拆分为了小段的数据，并将数据转换为向量。

然后分别存储数据和向量

拆分下来就是如下图

知识库中包含多个集合，集合可以理解为文件，文件中被拆分为多段，对应的就是数据，而数据分别以内容和向量的方式存储。

而在搜索的时候则以库为粒度进行搜索。

在FastGPT中，默认使用PostgresSQL中的PG Vector插件进行向量的检索。

实际的数据存储在MongoDB的dataset.datas表中。存储了index和原数据信息。

也就是先在PgSQL中进行向量的检索，然后在MongoDB中寻找原答案。

如果同一向量对应的数据被检索到了多次。那么会采取最高分为返回。

再之后，我们说下提高向量的搜索精度的方式和实现。

常见的有

提高分词分段的方式，如果一段话的内容完整，结果单一，那么在匹配时也会很精准，

精简index的内容。Index对应的内容少，会提高匹配精度

丰富index数量，一个chunk可以对应多组index

优化检索词，用户的问题往往是模糊或者缺失的，并不一定是一个完整清晰的问题。

微调向量模型，通过微调算法的方式，增强特定领域的检索效果。

对应到知识库之中。

可以通过问题优化来增强搜索

通过concat query 来增强连续对话准确性

通过Rerank模型来后置处理，提高精度。

通过RRF来合并多个查询库的结果。