調整・拡張可能なAgentic RAG:Deep ResearchからOpen Deep Wide Researchへの進化

2025年10月27日Ollie @PuppyAgenrt

概要

2025年、検索拡張生成(RAG)は、「静的パイプライン」から「自律エージェント」へのパラダイムシフトを経験しています。OpenAIのDeep Researchは、マルチステッププランニングツール呼び出し動的推論を通じて、複雑なリサーチタスクを分単位に短縮し、この方向性の可能性を示しました。しかし、そのクローズドなアーキテクチャと固定された戦略では、企業が求める制御性、コスト効率、データ主権のニーズを満たすことは困難です。本記事では、Open Deep Wide Research(ODWR)を提案します。これは、Deep Researchの中核機能を再現しつつ、開発者に深さ、幅、遅延に対するきめ細かな制御権を与えることを目的とした、オープンソースでMCP互換の、実行時戦略調整をサポートするAgentic RAGフレームワークです。


問題の背景:RAGの進化におけるボトルネック

従来のRAGシステムは、「検索→並べ替え→生成」という線形的なフローを採用しており、事実に基づく質疑応答には適していますが、以下のシナリオでは性能が不十分です。

  • マルチホップ推論:例えば、「AI企業3社の2024年~2025年におけるオープンソース戦略と、それが開発者エコシステムに与える影響を比較せよ」といったタスク。
  • 異種データ統合:Webページ、PDFの技術ホワイトペーパー、ユーザーがアップロードしたCSVレポートを同時に解析する必要がある場合。
  • 動的タスク調整:初期の検索結果の品質が低い場合に、自律的にクエリを修正したり、データソースを切り替えたりできない。

OpenAIのDeep Researchは、**エージェント型アーキテクチャを導入することでこれらの問題を解決しました。タスクをサブゴールに分解し、ブラウザやPythonツールを呼び出し、リアルタイムで戦略を調整し、引用付きの構造化レポートを出力します。この設計はAgentic RAG**の実現可能性を証明しましたが、同時にブラックボックスモデル、カスタムツールチェーンの欠如、リソーススケジューリングインターフェースの不在といった重要な限界も露呈しました。


アプローチの参考:Deep Researchからコアメカニズムを抽出

私たちはDeep Researchの公開技術情報(OpenAI, 2025)を分析し、再利用可能な3つの設計原則を抽出しました。

  1. 階層的タスクプランニング:ユーザーの指示を実行可能なリサーチパス(例:「競合製品の特定→パラメータの収集→クロス検証→比較表の生成」)に変換する。
  2. ツール連携実行:Webブラウザ、コードインタプリタ、ファイルパーサーを統合し、クローズドループを形成する。
  3. 証拠に基づく出力:各結論を元の情報源と関連付け、トレーサビリティと検証をサポートする。

これらのメカニズムは、**MCP(Model Context Protocol)**によって標準化・カプセル化できます。MCPは、エージェントとツールの間のコンテキスト伝達、状態同期、エラー回復プロトコルを定義し、異なるコンポーネント(LLM、クローラー、データベースなど)のプラグアンドプレイを可能にします。


実装:Open Deep Wide Researchアーキテクチャ

上記の洞察に基づき、私たちは**Open Deep Wide Research(ODWR)**を開発しました。これは、以下の特徴を持つ、オープンソースでセルフホスト可能なAgentic RAGシステムです。

1. MCP互換のエージェントコア

  • エージェントコントローラーはMCP仕様に準拠し、ツール(Seleniumブラウザ、PDFパーサー、SQLクエリエンジンなど)の動的読み込みをサポートします。
  • コンテキストは構造化JSONで渡され、タスクの状態、訪問済みURL、引用スニペット、信頼度スコアが含まれます。

2. 3つの次元で調整可能な戦略

ユーザーは実行時に以下を指定できます。

  • Depth(深さ):最大推論ステップ数(1~10ステップ)。ロジックの複雑さを制御します。
  • Width(幅):並列検索ソース数(5~100以上)。情報の網羅性に影響します。
  • Latency Budget(遅延予算):ハードな締め切り時間(30秒~30分)。タイムアウト時には自動的にダウングレードします。

:軽量モード(Depth=2, Width=10, Latency=2min)は製品比較に、ディープモード(Depth=8, Width=50, Latency=20min)は学術研究レビューに適しています。

3. ハイブリッド検索と再計画メカニズム

  • 初期検索には**HyDE + ベクトル + キーワード**のハイブリッド戦略を採用します。
  • 重要なサブタスクが失敗した場合(例:某企業の財務報告書が見つからない)、**バックトラック-リライト-リトライ**のループがトリガーされます。
  • ユーザーがファイルを「アンカー知識」としてアップロードし、検索の方向性を誘導することをサポートします。

4. オープンソースとセルフホスティング

  • コードはGitHubでホストされ、Dockerによるワンクリックデプロイをサポートします。
  • 主要なLLM(GPT-4oClaude 3.5DeepSeek-R1など)と互換性があり、統一されたMCPアダプタを介して接続します。
  • 出力形式はMarkdown + JSONで、Notion、Obsidian、または内部システムへの統合が容易です。

Deep Researchとの比較

項目OpenAI Deep ResearchOpen Deep Wide Research
アクセシビリティChatGPTの有料プランユーザー限定オープンソース、セルフホスト可能
ツール拡張性クローズド(OpenAIのみ提供)MCP互換、任意のツールがプラグイン可能
制御の粒度固定戦略Depth/Width/Latencyの3パラメータで調整可能
データ主権OpenAIクラウドに依存プライベートナレッジベースとローカル実行をサポート
出力・エクスポートChatGPT内のみAPI、JSON、Markdownでのエクスポートをサポート

導入:ODWRの機能を今すぐ体験

私たちはpuppyoneプラットフォームにODWRの簡易版を統合し、ユーザーがエンタープライズレベルのAgentic RAGアプリケーションを迅速に構築できるようにしました。

  • 技術ドキュメントをアップロードし、競合分析レポートを自動生成。
  • 内部データベースに接続し、「自然言語クエリ+外部リサーチ補完」を実現。
  • カスタマーサポートボットとしてデプロイし、ポリシードキュメントやユーザーマニュアルを自動引用。

Puppyoneは無料トライアルをサポートしており、チームコラボレーションや高並行処理シナリオ向けのProfessionalプランも提供しています。https://www.puppyone.ai/にアクセスして、あなたのAgentic RAG実践を始めましょう。


FAQ

Q1:ODWRはDeep Researchの代替となり得ますか? 機能的にはその80%以上のシナリオをカバーでき、特にデータプライバシーコスト管理、またはカスタムツールを必要とする企業に適しています。ただし、OpenAIの専有モデル(o3など)に依存する極めて複雑なタスクでは、パフォーマンスが若干劣る可能性があります。

Q2:使用するのにプログラミングの知識は必要ですか? Puppyoneのグラフィカルインターフェースを使えば、非技術者でもタスクテンプレートを設定できます。一方、開発者はMCP APIを通じてエージェントの挙動を詳細にカスタマイズできます。

Q3:コストはどのように管理できますか? ODWRでは、最大トークン消費量、ツール呼び出し回数、タイムアウトしきい値を設定できます。また、軽量モデル(o4-miniDeepSeek-Liteなど)に切り替えることで、推論コストを大幅に削減できます。