DeepResearch

月伴飞鱼 2025-05-19 17:28:25
AI相关 > AI技术
支付宝打赏 微信打赏

如果文章对你有帮助,欢迎点击上方按钮打赏作者!

Deep Search

RAG 中最核心的问题是 R,也就是检索,在面对模糊问题时,检索结果的精确性往往不高。

  • 面对复杂问题时,单次检索又不足以获取足够的上下文信息。

为了解决这些问题,人们又提出了 高级 RAG模块化 RAG 等概念。

通过 查询重写(Query Rewriting)查询扩展(Query Expansion) 等方法将用户的原始问题转换成更清晰。

  • 更适合检索的任务,这种方法也被称为 查询转换(Query Transformation)
query-transformation.png

Graph RAG

传统 RAG 在面对更复杂的问题时仍然是捉襟见肘,这些问题往往需要更深入搜索和推理。

全局性问题理解

传统 RAG 主要依赖向量检索,擅长回答局部的、具体的问题,但难以处理需要跨文档推理的全局性问题。

  • 近五年人工智能领域的论文中,哪些研究方向的热度增长最快?

复杂语义关系问答

传统 RAG 忽略了实体间的语义关系,导致回答缺乏逻辑连贯性。

  • 《哪吒2》是哪个公司发行的,这个公司还发行过哪些票房超10亿的电影?

多跳推理问题

  • 传统 RAG 无法处理需要多步推理的问题,因为向量检索仅返回单篇文档片段。
  • 《哪吒2》中哪吒配音的老家天气怎么样?

复杂条件筛选

依赖关键词匹配可能漏检,无法处理复合逻辑条件。

  • 找出所有总部在加州、员工超过1万人,且创始人毕业于斯坦福的科技公司。

2024 年上半年,微软公开了 Graph RAG 的论文:

通过结构化信息提升大模型生成内容的准确性、相关性和可解释性。

在年中的时候,Graph RAG 正式开源,在社区引起了相当的热度,在很短时间内就超过了上万星标。

graph-qa.png

Agentic RAG

上面这些 RAG 的流程基本上都是线性的,遵循着 检索-生成-结束 这样的固定流程。

后来,随着智能体的兴起,又出现了 Agentic RAG 的概念,这是传统 RAG 的进阶范式。

将智能体的任务规划、工具使用、反思重试等机制引入 RAG 流程中。

智能体的核心是 思考-行动-观察 循环,这三个组件在一个持续的循环中协同工作,从而实现智能体的自主性、交互性和决策能力。

  • 将智能体引入 RAG 系统,可以让其具备更动态、更灵活的检索与生成能力。

最直观的表现就是反复的检索:

  • 比如切换不同的数据源(工具使用),切换不同的检索词(子任务拆解、反思),直到用户问题解决为止。

本质上来说,Deep Search 就是 Agentic RAG

agentic-rag.png

Agentic RAG 的典型能力如下:

动态检索

根据生成内容的中间结果,决定是否需要二次检索,发现答案不完整时自动触发新搜索。

或者根据问题类型主动选择检索源,比如优先查数据库还是通用搜索引擎。

任务分解

将复杂问题拆解为子任务,比如用户的问题是 对比 A 和 B,那么需要先检索 A 的特性,再检索 B 的特性,最后综合比较。

工具调用

让 RAG 不仅仅局限于检索,也可以调用外部工具获取实时信息,比如查询股票价格和天气情况。

又或者执行计算或生成代码,比如通过 Python 代码分析数据,再生成结论。

反思与修正

对生成结果自我评估,发现不足时重新检索或调整生成策略,比如在生成报告时发现缺少某部分数据时能自动补充。

多轮交互

在对话中主动追问用户以澄清需求,比如用户的要求是:帮我找一些关于人工智能的论文。

可以追问要找的是什么领域,是 NLP 还是计算机视觉。

Agentic RAG 的开源实现,比如 LlamaIndexLangGraphsmolagents 等。

Deep Research

Deep Research 相比于 Deep Search 有几个更明显的特征:

  • 引入推理模型,思考时间更长,能处理更复杂的任务。
  • 能使用更多的工具,比如操作电脑、访问浏览器、编写代码等。
  • 更擅长论文写作和报告生成。

Deep Research 的典型场景:解决复杂任务、撰写行业研究报告、生成旅游攻略、竞品对比、教案制作等。

比如 AutoGLM 沉思可以通过任务拆解和浏览器轻松解决 《哪吒2》中哪吒配音的老家天气怎么样? 这种多跳问题。

支付宝打赏 微信打赏

如果文章对你有帮助,欢迎点击上方按钮打赏作者!