构建可调、可扩展的 Agentic RAG：从 Deep Research 到 Open Deep Wide Research

2025年10月27日Ollie @PuppyAgenrt

摘要

2025 年，检索增强生成（RAG）正经历从“静态管道”向“自主代理”的范式迁移。OpenAI 的 Deep Research 展示了这一方向的潜力：通过多步规划、工具调用与动态推理，将复杂研究任务压缩至分钟级。然而，其封闭架构与固定策略难以满足企业对可控性、成本效率与数据主权的需求。本文提出 Open Deep Wide Research（ODWR）——一个开源、MCP 兼容、支持运行时策略调节的 Agentic RAG 框架，旨在复现 Deep Research 的核心能力，同时赋予开发者对深度、广度与延迟的精细控制权。

问题背景：RAG 的演进瓶颈

传统 RAG 系统采用“检索 → 重排 → 生成”的线性流程，适用于事实性问答，但在以下场景中表现不足：

多跳推理：如“对比三家 AI 公司在 2024–2025 年的开源策略及其对开发者生态的影响”；
异构数据融合：需同时解析网页、PDF 技术白皮书与用户上传的 CSV 报表；
动态任务调整：当初始检索结果质量低时，无法自主修正查询或切换数据源。

OpenAI 的 Deep Research 通过引入**代理式架构** 解决了这些问题：它将任务分解为子目标，调用浏览器与 Python 工具，实时调整策略，并输出带引用的结构化报告。这一设计验证了 Agentic RAG 的可行性，但也暴露了关键局限：黑盒模型、无自定义工具链、缺乏资源调度接口。

方法借鉴：从 Deep Research 提炼核心机制

我们分析 Deep Research 的公开技术描述（OpenAI, 2025），提炼出三个可复用的设计原则：

分层任务规划：将用户指令转化为可执行的研究路径（如“识别竞品 → 收集参数 → 交叉验证 → 生成对比表”）；
工具协同执行：集成网络浏览器、代码解释器与文件解析器，形成闭环；
证据驱动输出：每项结论均关联原始来源，支持溯源与验证。

这些机制可通过 MCP（Model Context Protocol） 标准化封装。MCP 定义了代理与工具之间的上下文传递、状态同步与错误恢复协议，使不同组件（如 LLM、爬虫、数据库）可即插即用。

实践落地：Open Deep Wide Research 架构

基于上述洞察，我们开发了 Open Deep Wide Research（ODWR），一个开源、自托管的 Agentic RAG 系统，具备以下特性：

1. MCP 兼容代理核心

代理控制器遵循 MCP 规范，支持动态加载工具（如 Selenium 浏览器、PDF 解析器、SQL 查询引擎）；
上下文以结构化 JSON 传递，包含任务状态、已访问 URL、引用片段与置信度评分。

2. 三维度可调策略

用户可在运行时指定：

Depth（深度）：最大推理步数（1–10 步），控制逻辑复杂度；
Width（广度）：并行检索源数量（5–100+），影响信息覆盖；
Latency Budget（延迟预算）：硬性截止时间（30s–30min），超时自动降级。

示例：轻量模式（Depth=2, Width=10, Latency=2min）适用于产品对比；深度模式（Depth=8, Width=50, Latency=20min）用于科研综述。

3. 混合检索与重规划机制

初始检索采用 HyDE + 向量 + 关键词 混合策略；
若关键子任务失败（如未找到某公司财报），触发 回溯-重写-重试 循环；
支持用户上传文件作为“锚点知识”，引导检索方向。

4. 开源与自托管

代码托管于 GitHub，支持 Docker 一键部署；
兼容主流 LLM（GPT-4o、Claude 3.5、DeepSeek-R1 等），通过统一 MCP 适配器接入；
输出格式为 Markdown + JSON，便于集成至 Notion、Obsidian 或内部系统。

与 Deep Research 的对比

维度	OpenAI Deep Research	Open Deep Wide Research
可访问性	仅限 ChatGPT 订阅用户	开源、可自托管
工具扩展	封闭（仅 OpenAI 提供）	MCP 兼容，任意工具可插拔
控制粒度	固定策略	Depth/Width/Latency 三参数可调
数据主权	依赖 OpenAI 云	支持私有知识库与本地执行
输出导出	仅限 ChatGPT 内	支持 API、JSON、Markdown 导出

引流：立即体验 ODWR 能力

我们已在 puppyone 平台上集成 ODWR 的简化版，供用户快速构建企业级 Agentic RAG 应用：

上传技术文档，自动生成竞品分析报告；
连接内部数据库，实现“自然语言查询 + 外部研究补充”；
部署为客服机器人，自动引用政策文件与用户手册。

puppyone 支持免费试用，并提供 Professional 计划用于团队协作与高并发场景。欢迎访问 https://www.puppyone.ai/ 开启你的 Agentic RAG 实践。

FAQ

Q1：ODWR 能否替代 Deep Research？
在功能上可覆盖其 80% 以上场景，尤其适合需数据隐私、成本控制或定制工具的企业。但对于依赖 OpenAI 专有模型（如 o3）的极端复杂任务，性能可能略低。

Q2：是否需要编程基础才能使用？
通过 puppyone 的图形界面，非技术人员可配置任务模板；开发者则可通过 MCP API 深度定制代理行为。

Q3：如何控制成本？
ODWR 允许设置最大 token 消耗、工具调用次数与超时阈值，并支持切换至轻量模型（如 o4-mini 或 DeepSeek-Lite），显著降低推理开销。

Agentic RAG

面向深度研究的Agentic RAG：架构、机制与工程实践

This article presents a deep research–oriented Agentic RAG system that autonomously plans, iteratively retrieves, cross-validates information, and generates structured reports—completing expert-level research tasks in 2–4 minutes. It details the system’s three-phase workflow, dynamic reasoning engine, MCP-based tool integration, and performance on benchmarks like Humanity’s Last Exam (21.1%) and SimpleQA (93.9%). The piece also covers deployment challenges, cost-latency trade-offs, and introduces Open Deep Wide Research, an open-source, self-hostable implementation by puppyone with fine-grained Depth × Wide control.

Ollie @puppyone2025年10月27日

Agentic RAG

Open Deep Wide Research：面向大规模信息采集的通用型多智能体协作架构

This article explores a novel Agentic RAG architecture that leverages dedicated cloud virtual machines and generic multi-agent collaboration to automate wide-scale research tasks—such as cross-entity comparisons or market surveys—while addressing engineering challenges in latency, resource scheduling, and cost predictability.

Ollie @puppyone2025年10月26日

Agentic RAG

LLM 智能体架构解析：AI 系统如何实现从记忆到行动的飞跃

探索 LLM 智能体架构如何利用 Agentic RAG 和动态上下文库，从被动聊天机器人进化为能够规划、记忆和行动的自主 AI 系统——由 Puppyone.ai 等基础设施提供支持。

Ollie @puppyone2025年12月30日

构建可调、可扩展的 Agentic RAG：从 Deep Research 到 Open Deep Wide Research

摘要

问题背景：RAG 的演进瓶颈

方法借鉴：从 Deep Research 提炼核心机制

实践落地：Open Deep Wide Research 架构

1. MCP 兼容 代理核心

2. 三维度可调策略

3. 混合检索 与重规划机制

4. 开源与自托管

与 Deep Research 的对比

引流：立即体验 ODWR 能力

FAQ

相关文章

面向深度研究的Agentic RAG：架构、机制与工程实践

Open Deep Wide Research：面向大规模信息采集的通用型多智能体协作架构

LLM 智能体架构解析：AI 系统如何实现从记忆到行动的飞跃

1. MCP 兼容代理核心

3. 混合检索与重规划机制