构建可调、可扩展的 Agentic RAG:从 Deep Research 到 Open Deep Wide Research

2025年10月27日Ollie @PuppyAgenrt

摘要

2025 年,检索增强生成(RAG) 正经历从“静态管道”向“自主代理”的范式迁移。OpenAI 的 Deep Research 展示了这一方向的潜力:通过多步规划工具调用动态推理,将复杂研究任务压缩至分钟级。然而,其封闭架构与固定策略难以满足企业对可控性、成本效率与数据主权的需求。本文提出 Open Deep Wide Research(ODWR)——一个开源、MCP 兼容、支持运行时策略调节的 Agentic RAG 框架,旨在复现 Deep Research 的核心能力,同时赋予开发者对深度、广度与延迟的精细控制权。


问题背景:RAG 的演进瓶颈

传统 RAG 系统采用“检索 → 重排 → 生成”的线性流程,适用于事实性问答,但在以下场景中表现不足:

  • 多跳推理:如“对比三家 AI 公司在 2024–2025 年的开源策略及其对开发者生态的影响”;
  • 异构数据融合:需同时解析网页、PDF 技术白皮书与用户上传的 CSV 报表;
  • 动态任务调整:当初始检索结果质量低时,无法自主修正查询或切换数据源。

OpenAI 的 Deep Research 通过引入**代理式架构** 解决了这些问题:它将任务分解为子目标,调用浏览器与 Python 工具,实时调整策略,并输出带引用的结构化报告。这一设计验证了 Agentic RAG 的可行性,但也暴露了关键局限:黑盒模型、无自定义工具链、缺乏资源调度接口。


方法借鉴:从 Deep Research 提炼核心机制

我们分析 Deep Research 的公开技术描述(OpenAI, 2025),提炼出三个可复用的设计原则:

  1. 分层任务规划:将用户指令转化为可执行的研究路径(如“识别竞品 → 收集参数 → 交叉验证 → 生成对比表”);
  2. 工具协同执行:集成网络浏览器、代码解释器与文件解析器,形成闭环;
  3. 证据驱动输出:每项结论均关联原始来源,支持溯源与验证。

这些机制可通过 MCP(Model Context Protocol) 标准化封装。MCP 定义了代理与工具之间的上下文传递、状态同步与错误恢复协议,使不同组件(如 LLM、爬虫、数据库)可即插即用。


实践落地:Open Deep Wide Research 架构

基于上述洞察,我们开发了 Open Deep Wide Research(ODWR),一个开源、自托管的 Agentic RAG 系统,具备以下特性:

1. MCP 兼容 代理核心

  • 代理控制器遵循 MCP 规范,支持动态加载工具(如 Selenium 浏览器、PDF 解析器、SQL 查询引擎);
  • 上下文以结构化 JSON 传递,包含任务状态、已访问 URL、引用片段与置信度评分。

2. 三维度可调策略

用户可在运行时指定:

  • Depth(深度):最大推理步数(1–10 步),控制逻辑复杂度;
  • Width(广度):并行检索源数量(5–100+),影响信息覆盖;
  • Latency Budget(延迟预算):硬性截止时间(30s–30min),超时自动降级。

示例:轻量模式(Depth=2, Width=10, Latency=2min)适用于产品对比;深度模式(Depth=8, Width=50, Latency=20min)用于科研综述。

3. 混合检索 与重规划机制

  • 初始检索采用 HyDE + 向量 + 关键词 混合策略;
  • 若关键子任务失败(如未找到某公司财报),触发 回溯-重写-重试 循环;
  • 支持用户上传文件作为“锚点知识”,引导检索方向。

4. 开源与自托管

  • 代码托管于 GitHub,支持 Docker 一键部署;
  • 兼容主流 LLM(GPT-4oClaude 3.5DeepSeek-R1 等),通过统一 MCP 适配器接入;
  • 输出格式为 Markdown + JSON,便于集成至 Notion、Obsidian 或内部系统。

与 Deep Research 的对比

维度OpenAI Deep ResearchOpen Deep Wide Research
可访问性仅限 ChatGPT 订阅用户开源、可自托管
工具扩展封闭(仅 OpenAI 提供)MCP 兼容,任意工具可插拔
控制粒度固定策略Depth/Width/Latency 三参数可调
数据主权依赖 OpenAI 云支持私有知识库与本地执行
输出导出仅限 ChatGPT 内支持 API、JSON、Markdown 导出

引流:立即体验 ODWR 能力

我们已在 puppyone 平台上集成 ODWR 的简化版,供用户快速构建企业级 Agentic RAG 应用:

  • 上传技术文档,自动生成竞品分析报告;
  • 连接内部数据库,实现“自然语言查询 + 外部研究补充”;
  • 部署为客服机器人,自动引用政策文件与用户手册。

puppyone 支持免费试用,并提供 Professional 计划用于团队协作与高并发场景。欢迎访问 https://www.puppyone.ai/ 开启你的 Agentic RAG 实践。


FAQ

Q1:ODWR 能否替代 Deep Research?
在功能上可覆盖其 80% 以上场景,尤其适合需数据隐私成本控制定制工具的企业。但对于依赖 OpenAI 专有模型(如 o3)的极端复杂任务,性能可能略低。

Q2:是否需要编程基础才能使用?
通过 puppyone 的图形界面,非技术人员可配置任务模板;开发者则可通过 MCP API 深度定制代理行为。

Q3:如何控制成本?
ODWR 允许设置最大 token 消耗、工具调用次数与超时阈值,并支持切换至轻量模型(如 o4-miniDeepSeek-Lite),显著降低推理开销。