DeepResearch

月伴飞鱼 2025-05-19 17:28:25

AI相关 > AI技术

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！

Deep Search

RAG 中最核心的问题是 R，也就是检索，在面对模糊问题时，检索结果的精确性往往不高。

面对复杂问题时，单次检索又不足以获取足够的上下文信息。

为了解决这些问题，人们又提出了 高级 RAG 和 模块化 RAG 等概念。

通过 查询重写（Query Rewriting）、查询扩展（Query Expansion） 等方法将用户的原始问题转换成更清晰。

更适合检索的任务，这种方法也被称为 查询转换（Query Transformation）

Graph RAG

传统 RAG 在面对更复杂的问题时仍然是捉襟见肘，这些问题往往需要更深入搜索和推理。

全局性问题理解：

传统 RAG 主要依赖向量检索，擅长回答局部的、具体的问题，但难以处理需要跨文档推理的全局性问题。

近五年人工智能领域的论文中，哪些研究方向的热度增长最快？

复杂语义关系问答：

传统 RAG 忽略了实体间的语义关系，导致回答缺乏逻辑连贯性。

《哪吒2》是哪个公司发行的，这个公司还发行过哪些票房超10亿的电影？

多跳推理问题：

传统 RAG 无法处理需要多步推理的问题，因为向量检索仅返回单篇文档片段。

《哪吒2》中哪吒配音的老家天气怎么样？

复杂条件筛选：

依赖关键词匹配可能漏检，无法处理复合逻辑条件。

找出所有总部在加州、员工超过1万人，且创始人毕业于斯坦福的科技公司。

2024 年上半年，微软公开了 Graph RAG 的论文：

From Local to Global: A Graph RAG Approach to Query-Focused Summarization。

将知识图谱的概念引入 RAG 中。

通过结构化信息提升大模型生成内容的准确性、相关性和可解释性。

在年中的时候，Graph RAG 正式开源，在社区引起了相当的热度，在很短时间内就超过了上万星标。

Agentic RAG

上面这些 RAG 的流程基本上都是线性的，遵循着 检索-生成-结束 这样的固定流程。

后来，随着智能体的兴起，又出现了 Agentic RAG 的概念，这是传统 RAG 的进阶范式。

将智能体的任务规划、工具使用、反思重试等机制引入 RAG 流程中。

智能体的核心是 思考-行动-观察 循环，这三个组件在一个持续的循环中协同工作，从而实现智能体的自主性、交互性和决策能力。

将智能体引入 RAG 系统，可以让其具备更动态、更灵活的检索与生成能力。

最直观的表现就是反复的检索：

比如切换不同的数据源（工具使用），切换不同的检索词（子任务拆解、反思），直到用户问题解决为止。

本质上来说，Deep Search 就是 Agentic RAG。

Agentic RAG 的典型能力如下：

动态检索：

根据生成内容的中间结果，决定是否需要二次检索，发现答案不完整时自动触发新搜索。

或者根据问题类型主动选择检索源，比如优先查数据库还是通用搜索引擎。

任务分解：

将复杂问题拆解为子任务，比如用户的问题是对比 A 和 B，那么需要先检索 A 的特性，再检索 B 的特性，最后综合比较。

工具调用：

让 RAG 不仅仅局限于检索，也可以调用外部工具获取实时信息，比如查询股票价格和天气情况。

又或者执行计算或生成代码，比如通过 Python 代码分析数据，再生成结论。

反思与修正：

对生成结果自我评估，发现不足时重新检索或调整生成策略，比如在生成报告时发现缺少某部分数据时能自动补充。

多轮交互：

在对话中主动追问用户以澄清需求，比如用户的要求是：帮我找一些关于人工智能的论文。

可以追问要找的是什么领域，是 NLP 还是计算机视觉。

Agentic RAG 的开源实现，比如 LlamaIndex、LangGraph、smolagents 等。

Deep Research

Deep Research 相比于 Deep Search 有几个更明显的特征：

引入推理模型，思考时间更长，能处理更复杂的任务。

能使用更多的工具，比如操作电脑、访问浏览器、编写代码等。

更擅长论文写作和报告生成。

Deep Research 的典型场景：解决复杂任务、撰写行业研究报告、生成旅游攻略、竞品对比、教案制作等。

比如 AutoGLM 沉思可以通过任务拆解和浏览器轻松解决 《哪吒2》中哪吒配音的老家天气怎么样？ 这种多跳问题。

赏

支付宝打赏

微信打赏

如果文章对你有帮助，欢迎点击上方按钮打赏作者！

LangGraph

Embedding