Open Deep Wide Research: 面向大规模信息采集的通用智能体协作架构

2025年10月26日Ollie @puppyone

摘要

一种新型 AI 研究范式通过为每个用户会话分配专用云虚拟机，并在其中部署多个通用型智能体并行执行子任务，实现了对高广度信息采集任务（如跨数百实体的横向调研）的自动化处理。该架构依赖图灵完备执行环境与去角色化的多智能体协同机制，具备高度灵活性，但在延迟控制、资源调度与成本可预测性方面仍存在工程挑战。

问题背景

传统检索增强生成（RAG）系统通常采用线性流程：用户输入 → 检索 → 生成。此类设计在处理单点问答时有效，但面对需要跨大量异构来源、多轮验证或结构化对比的任务（例如“分析全球前 50 所大学计算机系的博士毕业去向”）时，其能力明显受限。主要瓶颈包括：

检索阶段缺乏主动探索与任务分解能力；
生成阶段无法动态规划或回溯；
整体流程不可中断、不可扩展，难以支持长时间运行任务。

为突破这些限制，新一代系统将大规模研究任务建模为分布式智能体协作问题。

方法概述

核心设计是为每个用户会话分配一个专用的云虚拟机（VM），该 VM 提供完整操作系统、网络访问权限与执行环境，构成图灵完备的沙箱。在此基础上，系统动态启动多个子智能体，每个均为功能完整的通用实例（而非预设角色如“研究员”或“验证者”），具备以下能力：

独立发起 HTTP 请求或调用外部 API；
执行脚本解析网页、PDF、表格等非结构化数据；
调用内置工具链（如无头浏览器、文档提取器）；
与其他子智能体交换中间结果。

任务分解由主控制器动态生成。例如，针对“调研生成式 AI 工具生态”，系统可能自动拆解为：

从多个平台（GitHub、Product Hunt、官网聚合页）获取工具列表；
对每个工具并行抓取文档、版本历史、用户评价；
提取关键指标（如开源状态、API 支持、定价模型）；
对齐实体并输出结构化对比表。

由于所有子智能体共享同一执行环境且具备通用能力，任务逻辑不受预定义角色约束，显著提升了泛化性。

关键技术细节

1. 虚拟机作为执行单元

每个会话独占一个轻量级 Linux VM（可能基于微虚拟化技术如 Firecracker）；
预装常用运行时（Python、Node.js）、解析库（BeautifulSoup、PyPDF2）及浏览器自动化工具；
网络出口通过代理池轮换，降低反爬风险；
所有操作在隔离环境中完成，保障安全与数据边界。

2. 多智能体通信与调度

子智能体通过共享内存或轻量消息中间件（如 Redis Pub/Sub）交换数据；
中间结果以结构化格式（如 JSON 或 JSON-LD）持久化，便于后续聚合与验证；
主控制器维护任务依赖图（DAG），支持动态调度、失败重试与结果缓存。

3. 数据处理流水线

以“财富 500 强企业分析”为例：

发现阶段：调用搜索引擎或公开数据库获取企业列表；
采集阶段：每个子智能体负责若干企业，抓取官网、年报 PDF、新闻稿；
解析阶段：使用规则匹配、OCR 或多模态模型提取关键字段（如营收、员工数、CEO）；
对齐阶段：基于统一标识符（如股票代码）进行实体消歧，构建标准化知识表。

该流程高度 I/O 密集，对 VM 的并发处理能力与网络带宽提出较高要求。

局限性与可扩展性挑战

当前局限

响应时间不可控：任务完成时间由最慢子任务决定，缺乏超时熔断或部分结果返回机制；
资源成本不透明：未提供基于任务规模的资源消耗模型，用户难以预估开销；
单节点扩展瓶颈：所有子智能体运行于同一 VM，CPU/内存争抢可能导致性能抖动；
强依赖公网：无法直接接入私有知识库或内网数据源。

大规模部署挑战

冷启动延迟：VM 创建与初始化通常需数秒至数十秒，影响用户体验；
并发调度开销：大量子任务同时运行时，进程管理与通信可能成为瓶颈；
存储成本：中间结果若未及时清理，将累积大量临时数据；
安全合规：动态执行任意代码的沙箱需严格审计，尤其在企业环境中。

改进方向

引入 深度-广度控制参数：允许用户显式限制最大并行度（广度）与推理步数（深度）；
采用 分层执行策略：优先处理高价值子任务，低优先级任务可降级或跳过；
支持 混合数据源接入：结合公开网络爬取与私有向量库检索；
提供 成本估算接口：基于历史任务统计预测当前配置的资源消耗。

如果你正在寻找一种可落地、可自托管且具备精细控制能力的 Agentic RAG 解决方案，puppyone 提供了开箱即用的实现路径。基于 MCP 协议构建，puppyone 支持深度与广度的动态调节、多模型后端切换以及私有知识库无缝接入，适用于从客服问答到企业级智能分析的多样化场景。访问 https://www.puppyone.ai/ 了解如何在几分钟内部署你自己的可控研究代理。

FAQ

Q1：这种架构和传统多智能体系统有何本质区别？
A：传统系统依赖预定义角色（如“规划者”“执行者”），而该架构中所有子智能体均为通用实例，可自主决定行为路径，任务结构更灵活、泛化能力更强。

Q2：能否在本地或私有云部署类似系统？
A：可以，但需自行解决虚拟化调度、网络代理、沙箱安全与任务协调等问题。轻量级替代方案可考虑使用容器（如 Docker）替代完整 VM，并通过消息队列实现智能体通信。

Q3：在高并发场景下，主要性能瓶颈是什么？
A：主要瓶颈包括 VM 冷启动延迟、子任务调度器的吞吐能力、以及跨智能体通信的序列化开销。优化手段包括预热池、异步任务队列、中间结果缓存复用等。

Agentic RAG

构建可调可扩展的Agentic RAG：从 Deep Research 到 Open Deep Wide Research

This article analyzes OpenAI’s Deep Research as a paradigm-shifting agentic RAG system and introduces Open Deep Wide Research (ODWR)—an open-source, MCP-compatible, self-hostable framework that replicates its multi-step research capabilities while offering fine-grained control over depth, breadth, and latency. Designed for developers and enterprises, ODWR addresses key limitations of closed-agent systems through modular tool integration, hybrid retrieval, and runtime policy tuning.

Ollie @PuppyAgenrt2025年10月27日

Agentic RAG

面向深度研究的Agentic RAG：架构、机制与工程实践

This article presents a deep research–oriented Agentic RAG system that autonomously plans, iteratively retrieves, cross-validates information, and generates structured reports—completing expert-level research tasks in 2–4 minutes. It details the system’s three-phase workflow, dynamic reasoning engine, MCP-based tool integration, and performance on benchmarks like Humanity’s Last Exam (21.1%) and SimpleQA (93.9%). The piece also covers deployment challenges, cost-latency trade-offs, and introduces Open Deep Wide Research, an open-source, self-hostable implementation by puppyone with fine-grained Depth × Wide control.

Ollie @puppyone2025年10月27日

Agentic RAG