調整・拡張可能なAgentic RAG：Deep ResearchからOpen Deep Wide Researchへの進化

2025年10月27日Ollie @PuppyAgenrt

概要

2025年、検索拡張生成（RAG）は、「静的パイプライン」から「自律エージェント」へのパラダイムシフトを経験しています。OpenAIのDeep Researchは、マルチステッププランニング、ツール呼び出し、動的推論を通じて、複雑なリサーチタスクを分単位に短縮し、この方向性の可能性を示しました。しかし、そのクローズドなアーキテクチャと固定された戦略では、企業が求める制御性、コスト効率、データ主権のニーズを満たすことは困難です。本記事では、Open Deep Wide Research（ODWR）を提案します。これは、Deep Researchの中核機能を再現しつつ、開発者に深さ、幅、遅延に対するきめ細かな制御権を与えることを目的とした、オープンソースでMCP互換の、実行時戦略調整をサポートするAgentic RAGフレームワークです。

問題の背景：RAGの進化におけるボトルネック

従来のRAGシステムは、「検索→並べ替え→生成」という線形的なフローを採用しており、事実に基づく質疑応答には適していますが、以下のシナリオでは性能が不十分です。

マルチホップ推論：例えば、「AI企業3社の2024年～2025年におけるオープンソース戦略と、それが開発者エコシステムに与える影響を比較せよ」といったタスク。
異種データ統合：Webページ、PDFの技術ホワイトペーパー、ユーザーがアップロードしたCSVレポートを同時に解析する必要がある場合。
動的タスク調整：初期の検索結果の品質が低い場合に、自律的にクエリを修正したり、データソースを切り替えたりできない。

OpenAIのDeep Researchは、**エージェント型アーキテクチャを導入することでこれらの問題を解決しました。タスクをサブゴールに分解し、ブラウザやPythonツールを呼び出し、リアルタイムで戦略を調整し、引用付きの構造化レポートを出力します。この設計はAgentic RAG**の実現可能性を証明しましたが、同時にブラックボックスモデル、カスタムツールチェーンの欠如、リソーススケジューリングインターフェースの不在といった重要な限界も露呈しました。

アプローチの参考：Deep Researchからコアメカニズムを抽出

私たちはDeep Researchの公開技術情報（OpenAI, 2025）を分析し、再利用可能な3つの設計原則を抽出しました。

階層的タスクプランニング：ユーザーの指示を実行可能なリサーチパス（例：「競合製品の特定→パラメータの収集→クロス検証→比較表の生成」）に変換する。
ツール連携実行：Webブラウザ、コードインタプリタ、ファイルパーサーを統合し、クローズドループを形成する。
証拠に基づく出力：各結論を元の情報源と関連付け、トレーサビリティと検証をサポートする。

これらのメカニズムは、**MCP（Model Context Protocol）**によって標準化・カプセル化できます。MCPは、エージェントとツールの間のコンテキスト伝達、状態同期、エラー回復プロトコルを定義し、異なるコンポーネント（LLM、クローラー、データベースなど）のプラグアンドプレイを可能にします。

実装：Open Deep Wide Researchアーキテクチャ

上記の洞察に基づき、私たちは**Open Deep Wide Research（ODWR）**を開発しました。これは、以下の特徴を持つ、オープンソースでセルフホスト可能なAgentic RAGシステムです。

1. MCP互換のエージェントコア

エージェントコントローラーはMCP仕様に準拠し、ツール（Seleniumブラウザ、PDFパーサー、SQLクエリエンジンなど）の動的読み込みをサポートします。
コンテキストは構造化JSONで渡され、タスクの状態、訪問済みURL、引用スニペット、信頼度スコアが含まれます。

2. 3つの次元で調整可能な戦略

ユーザーは実行時に以下を指定できます。

Depth（深さ）：最大推論ステップ数（1～10ステップ）。ロジックの複雑さを制御します。
Width（幅）：並列検索ソース数（5～100以上）。情報の網羅性に影響します。
Latency Budget（遅延予算）：ハードな締め切り時間（30秒～30分）。タイムアウト時には自動的にダウングレードします。

例：軽量モード（Depth=2, Width=10, Latency=2min）は製品比較に、ディープモード（Depth=8, Width=50, Latency=20min）は学術研究レビューに適しています。

3. ハイブリッド検索と再計画メカニズム

初期検索には**HyDE + ベクトル + キーワード**のハイブリッド戦略を採用します。
重要なサブタスクが失敗した場合（例：某企業の財務報告書が見つからない）、**バックトラック-リライト-リトライ**のループがトリガーされます。
ユーザーがファイルを「アンカー知識」としてアップロードし、検索の方向性を誘導することをサポートします。

4. オープンソースとセルフホスティング

コードはGitHubでホストされ、Dockerによるワンクリックデプロイをサポートします。
主要なLLM（GPT-4o、Claude 3.5、DeepSeek-R1など）と互換性があり、統一されたMCPアダプタを介して接続します。
出力形式はMarkdown + JSONで、Notion、Obsidian、または内部システムへの統合が容易です。

Deep Researchとの比較

項目	OpenAI Deep Research	Open Deep Wide Research
アクセシビリティ	ChatGPTの有料プランユーザー限定	オープンソース、セルフホスト可能
ツール拡張性	クローズド（OpenAIのみ提供）	MCP互換、任意のツールがプラグイン可能
制御の粒度	固定戦略	Depth/Width/Latencyの3パラメータで調整可能
データ主権	OpenAIクラウドに依存	プライベートナレッジベースとローカル実行をサポート
出力・エクスポート	ChatGPT内のみ	API、JSON、Markdownでのエクスポートをサポート

導入：ODWRの機能を今すぐ体験

私たちはpuppyoneプラットフォームにODWRの簡易版を統合し、ユーザーがエンタープライズレベルのAgentic RAGアプリケーションを迅速に構築できるようにしました。

技術ドキュメントをアップロードし、競合分析レポートを自動生成。
内部データベースに接続し、「自然言語クエリ＋外部リサーチ補完」を実現。
カスタマーサポートボットとしてデプロイし、ポリシードキュメントやユーザーマニュアルを自動引用。

Puppyoneは無料トライアルをサポートしており、チームコラボレーションや高並行処理シナリオ向けのProfessionalプランも提供しています。https://www.puppyone.ai/にアクセスして、あなたのAgentic RAG実践を始めましょう。

FAQ

Q1：ODWRはDeep Researchの代替となり得ますか？ 機能的にはその80%以上のシナリオをカバーでき、特にデータプライバシー、コスト管理、またはカスタムツールを必要とする企業に適しています。ただし、OpenAIの専有モデル（o3など）に依存する極めて複雑なタスクでは、パフォーマンスが若干劣る可能性があります。

Q2：使用するのにプログラミングの知識は必要ですか？ Puppyoneのグラフィカルインターフェースを使えば、非技術者でもタスクテンプレートを設定できます。一方、開発者はMCP APIを通じてエージェントの挙動を詳細にカスタマイズできます。

Q3：コストはどのように管理できますか？ ODWRでは、最大トークン消費量、ツール呼び出し回数、タイムアウトしきい値を設定できます。また、軽量モデル（o4-miniやDeepSeek-Liteなど）に切り替えることで、推論コストを大幅に削減できます。

Agentic RAG

深いリサーチ向けエージェンティックRAG：アーキテクチャ、メカニズム、エンジニアリング実践

本記事では、自律的な計画、反復的な検索、情報検証を通じて、専門家レベルの調査タスクを2～4分で完了させる高度な調査研究向けエージェント型RAGシステムを紹介します。システムのワークフロー、動的推論エンジン、ベンチマーク性能、そしてpuppyoneによるオープンソース実装「Deep Wide Research」について、導入の課題とともに詳しく解説します。

Ollie @puppyone2025年10月27日

Agentic RAG