Deep Search
RAG 中最核心的问题是 R,也就是检索,在面对模糊问题时,检索结果的精确性往往不高。
- 面对复杂问题时,单次检索又不足以获取足够的上下文信息。
为了解决这些问题,人们又提出了 高级 RAG 和 模块化 RAG 等概念。
通过 查询重写(Query Rewriting)、查询扩展(Query Expansion) 等方法将用户的原始问题转换成更清晰。
- 更适合检索的任务,这种方法也被称为 查询转换(Query Transformation)

Graph RAG
传统 RAG 在面对更复杂的问题时仍然是捉襟见肘,这些问题往往需要更深入搜索和推理。
全局性问题理解:
传统 RAG 主要依赖向量检索,擅长回答局部的、具体的问题,但难以处理需要跨文档推理的全局性问题。
- 近五年人工智能领域的论文中,哪些研究方向的热度增长最快?
复杂语义关系问答:
传统 RAG 忽略了实体间的语义关系,导致回答缺乏逻辑连贯性。
- 《哪吒2》是哪个公司发行的,这个公司还发行过哪些票房超10亿的电影?
多跳推理问题:
- 传统 RAG 无法处理需要多步推理的问题,因为向量检索仅返回单篇文档片段。
- 《哪吒2》中哪吒配音的老家天气怎么样?
复杂条件筛选:
依赖关键词匹配可能漏检,无法处理复合逻辑条件。
- 找出所有总部在加州、员工超过1万人,且创始人毕业于斯坦福的科技公司。
2024 年上半年,微软公开了 Graph RAG 的论文:
- From Local to Global: A Graph RAG Approach to Query-Focused Summarization。
- 将知识图谱的概念引入 RAG 中。
通过结构化信息提升大模型生成内容的准确性、相关性和可解释性。
在年中的时候,Graph RAG 正式开源,在社区引起了相当的热度,在很短时间内就超过了上万星标。

Agentic RAG
上面这些 RAG 的流程基本上都是线性的,遵循着 检索-生成-结束 这样的固定流程。
后来,随着智能体的兴起,又出现了 Agentic RAG 的概念,这是传统 RAG 的进阶范式。
将智能体的任务规划、工具使用、反思重试等机制引入 RAG 流程中。
智能体的核心是 思考-行动-观察 循环,这三个组件在一个持续的循环中协同工作,从而实现智能体的自主性、交互性和决策能力。
- 将智能体引入 RAG 系统,可以让其具备更动态、更灵活的检索与生成能力。
最直观的表现就是反复的检索:
- 比如切换不同的数据源(工具使用),切换不同的检索词(子任务拆解、反思),直到用户问题解决为止。
本质上来说,Deep Search 就是 Agentic RAG。

Agentic RAG 的典型能力如下:
动态检索:
根据生成内容的中间结果,决定是否需要二次检索,发现答案不完整时自动触发新搜索。
或者根据问题类型主动选择检索源,比如优先查数据库还是通用搜索引擎。
任务分解:
将复杂问题拆解为子任务,比如用户的问题是 对比 A 和 B,那么需要先检索 A 的特性,再检索 B 的特性,最后综合比较。
工具调用:
让 RAG 不仅仅局限于检索,也可以调用外部工具获取实时信息,比如查询股票价格和天气情况。
又或者执行计算或生成代码,比如通过 Python 代码分析数据,再生成结论。
反思与修正:
对生成结果自我评估,发现不足时重新检索或调整生成策略,比如在生成报告时发现缺少某部分数据时能自动补充。
多轮交互:
在对话中主动追问用户以澄清需求,比如用户的要求是:帮我找一些关于人工智能的论文。
可以追问要找的是什么领域,是 NLP 还是计算机视觉。
Agentic RAG 的开源实现,比如 LlamaIndex、LangGraph、smolagents 等。
Deep Research
Deep Research 相比于 Deep Search 有几个更明显的特征:
- 引入推理模型,思考时间更长,能处理更复杂的任务。
- 能使用更多的工具,比如操作电脑、访问浏览器、编写代码等。
- 更擅长论文写作和报告生成。
Deep Research 的典型场景:解决复杂任务、撰写行业研究报告、生成旅游攻略、竞品对比、教案制作等。
比如 AutoGLM 沉思可以通过任务拆解和浏览器轻松解决
《哪吒2》中哪吒配音的老家天气怎么样?
这种多跳问题。