摘要
2025 年,检索增强生成(RAG) 正经历从“静态管道”向“自主代理”的范式迁移。OpenAI 的 Deep Research 展示了这一方向的潜力:通过多步规划、工具调用与动态推理,将复杂研究任务压缩至分钟级。然而,其封闭架构与固定策略难以满足企业对可控性、成本效率与数据主权的需求。本文提出 Open Deep Wide Research(ODWR)——一个开源、MCP 兼容、支持运行时策略调节的 Agentic RAG 框架,旨在复现 Deep Research 的核心能力,同时赋予开发者对深度、广度与延迟的精细控制权。
问题背景:RAG 的演进瓶颈
传统 RAG 系统采用“检索 → 重排 → 生成”的线性流程,适用于事实性问答,但在以下场景中表现不足:
- 多跳推理:如“对比三家 AI 公司在 2024–2025 年的开源策略及其对开发者生态的影响”;
- 异构数据融合:需同时解析网页、PDF 技术白皮书与用户上传的 CSV 报表;
- 动态任务调整:当初始检索结果质量低时,无法自主修正查询或切换数据源。
OpenAI 的 Deep Research 通过引入**代理式架构** 解决了这些问题:它将任务分解为子目标,调用浏览器与 Python 工具,实时调整策略,并输出带引用的结构化报告。这一设计验证了 Agentic RAG 的可行性,但也暴露了关键局限:黑盒模型、无自定义工具链、缺乏资源调度接口。
方法借鉴:从 Deep Research 提炼核心机制
我们分析 Deep Research 的公开技术描述(OpenAI, 2025),提炼出三个可复用的设计原则:
- 分层任务规划:将用户指令转化为可执行的研究路径(如“识别竞品 → 收集参数 → 交叉验证 → 生成对比表”);
- 工具协同执行:集成网络浏览器、代码解释器与文件解析器,形成闭环;
- 证据驱动输出:每项结论均关联原始来源,支持溯源与验证。
这些机制可通过 MCP(Model Context Protocol) 标准化封装。MCP 定义了代理与工具之间的上下文传递、状态同步与错误恢复协议,使不同组件(如 LLM、爬虫、数据库)可即插即用。
实践落地:Open Deep Wide Research 架构
基于上述洞察,我们开发了 Open Deep Wide Research(ODWR),一个开源、自托管的 Agentic RAG 系统,具备以下特性:
- 代理控制器遵循 MCP 规范,支持动态加载工具(如 Selenium 浏览器、PDF 解析器、SQL 查询引擎);
- 上下文以结构化 JSON 传递,包含任务状态、已访问 URL、引用片段与置信度评分。
2. 三维度可调策略
用户可在运行时指定:
- Depth(深度):最大推理步数(1–10 步),控制逻辑复杂度;
- Width(广度):并行检索源数量(5–100+),影响信息覆盖;
- Latency Budget(延迟预算):硬性截止时间(30s–30min),超时自动降级。
示例:轻量模式(Depth=2, Width=10, Latency=2min)适用于产品对比;深度模式(Depth=8, Width=50, Latency=20min)用于科研综述。
3. 混合检索 与重规划机制
4. 开源与自托管
与 Deep Research 的对比
引流:立即体验 ODWR 能力
我们已在 puppyone 平台上集成 ODWR 的简化版,供用户快速构建企业级 Agentic RAG 应用:
- 上传技术文档,自动生成竞品分析报告;
- 连接内部数据库,实现“自然语言查询 + 外部研究补充”;
- 部署为客服机器人,自动引用政策文件与用户手册。
puppyone 支持免费试用,并提供 Professional 计划用于团队协作与高并发场景。欢迎访问 https://www.puppyone.ai/ 开启你的 Agentic RAG 实践。
FAQ
Q1:ODWR 能否替代 Deep Research?
在功能上可覆盖其 80% 以上场景,尤其适合需数据隐私、成本控制或定制工具的企业。但对于依赖 OpenAI 专有模型(如 o3)的极端复杂任务,性能可能略低。
Q2:是否需要编程基础才能使用?
通过 puppyone 的图形界面,非技术人员可配置任务模板;开发者则可通过 MCP API 深度定制代理行为。
Q3:如何控制成本?
ODWR 允许设置最大 token 消耗、工具调用次数与超时阈值,并支持切换至轻量模型(如 o4-mini 或 DeepSeek-Lite),显著降低推理开销。