在 Dify 的 v0.15.0 版本中引入了新的分段模式—父子模式。
官方介绍使用该模式可以在一定程度上增强知识库的检索能力和理解能力,从而显著提高 AI 生成回答的质量和准确度。
解决什么问题?
首先,在知识库检索中会有两种不利于生成准确回答的情况:
- 检索的结果是比较准确的,但是结果是从不同的分段中拿到的,比较分散,导致没有一个完整的上下文提供给 AI。
- 检索的结果不太精准,比较泛化,和上面一条刚好相反,上下文可能够了,但是精准度不够。
要解决上述问题,要做到两点:
- 合适的分块
- 平衡精准度和上下文之间的效果
运行原理
先整体后细化:
- 子模块匹配查询:先进行子块进行精准打击,这一部分会拆得比较细,甚至一句话就是一个块。
- 父模块提供上下文:然后根据匹配到的子块找到对应的父级,补充一下这块的信息,丰富一下匹配内容。

举个简单点的例子:学校-年级-班级-学生。
假如我们要找小明,子模式检索出来的结果是某班级的小明或者小明本人。
父模式就是提供小明所在的年纪、学校、以及在学校里的排名和表现等等。
但是随着检索能力提升带来的是分段时间的增长。