Aufbau eines anpassbaren, skalierbaren agentenbasierten RAG: Von Deep Research zu Open Deep Wide Research

27. Oktober 2025Ollie @PuppyAgenrt

Abstract

Im Jahr 2025 durchläuft die Retrieval-Augmented Generation (RAG) einen Paradigmenwechsel von „statischen Pipelines“ zu „autonomen Agenten". OpenAI's Deep Research demonstriert das Potenzial dieser Entwicklung, indem es komplexe Rechercheaufgaben durch mehrstufige Planung, Tool-Nutzung und dynamisches Schlussfolgern auf wenige Minuten komprimiert. Jedoch kann die geschlossene Architektur mit ihren starren Strategien die Anforderungen von Unternehmen an Kontrollierbarkeit, Kosteneffizienz und Datenhoheit nur schwer erfüllen. Dieser Artikel stellt Open Deep Wide Research (ODWR) vor – ein Open-Source-, MCP-kompatibles, agentenbasiertes RAG-Framework, das die Anpassung von Richtlinien zur Laufzeit unterstützt. Es zielt darauf ab, die Kernfähigkeiten von Deep Research nachzubilden und Entwicklern gleichzeitig eine granulare Kontrolle über Tiefe, Breite und Latenz zu geben.

Problemhintergrund: Die evolutionären Engpässe von RAG

Traditionelle RAG-Systeme verwenden eine lineare „Retrieve → Rerank → Generate“-Pipeline. Diese eignet sich gut für die Beantwortung faktenbasierter Fragen, stößt aber in den folgenden Szenarien an ihre Grenzen:

Mehrstufiges Schlussfolgern (Multi-hop Reasoning): Zum Beispiel: „Vergleichen Sie die Open-Source-Strategien von drei KI-Unternehmen im Zeitraum 2024–2025 und deren Auswirkungen auf das Entwickler-Ökosystem.“
Fusion heterogener Daten: Erfordert das gleichzeitige Parsen von Webseiten, technischen Whitepapers im PDF-Format und vom Benutzer hochgeladenen CSV-Berichten.
Dynamische Aufgabenanpassung: Wenn die ersten Retrieval-Ergebnisse von geringer Qualität sind, kann das System nicht autonom Anfragen korrigieren oder die Datenquellen wechseln.

OpenAI's Deep Research löst diese Probleme durch die Einführung einer agentenbasierten Architektur: Es zerlegt Aufgaben in Teilziele, ruft Browser- und Python-Tools auf, passt Strategien in Echtzeit an und gibt strukturierte Berichte mit Quellenangaben aus. Dieses Design bestätigt die Machbarkeit von agentenbasiertem RAG, deckt aber auch wesentliche Einschränkungen auf: Blackbox-Modelle, keine benutzerdefinierten Toolchains und fehlende Schnittstellen für die Ressourcenplanung.

Methodik: Destillation der Kernmechanismen von Deep Research

Wir haben die öffentlichen technischen Beschreibungen von Deep Research (OpenAI, 2025) analysiert und drei wiederverwendbare Designprinzipien extrahiert:

Hierarchische Aufgabenplanung: Übersetzung von Benutzeranweisungen in einen ausführbaren Recherchepfad (z. B. „Wettbewerber identifizieren → Parameter sammeln → gegenprüfen → Vergleichstabelle erstellen“).
Kollaborative Tool-Ausführung: Integration von Webbrowsern, Code-Interpretern und Datei-Parsern, um einen geschlossenen Kreislauf zu bilden.
Evidenzbasierte Ausgabe: Jede Schlussfolgerung ist mit ihrer Originalquelle verknüpft, was die Nachvollziehbarkeit und Überprüfung unterstützt.

Diese Mechanismen können über das Model Context Protocol (MCP) standardisiert und gekapselt werden. MCP definiert die Protokolle für die Kontextübergabe, Zustandssynchronisierung und Fehlerbehebung zwischen Agenten und Tools, wodurch verschiedene Komponenten (wie LLMs, Crawler und Datenbanken) per Plug-and-Play austauschbar werden.

Implementierung: Die Architektur von Open Deep Wide Research

Basierend auf diesen Erkenntnissen haben wir Open Deep Wide Research (ODWR) entwickelt, ein Open-Source-, selbst gehostetes agentenbasiertes RAG-System mit den folgenden Merkmalen:

1. MCP-kompatibler Agenten-Kern

Der Agenten-Controller hält sich an die MCP-Spezifikation und unterstützt das dynamische Laden von Tools (z. B. Selenium-Browser, PDF-Parser, SQL-Abfrage-Engine).
Der Kontext wird als strukturiertes JSON übergeben und enthält Aufgabenstatus, besuchte URLs, zitierte Textausschnitte und Konfidenzwerte.

2. Dreidimensional anpassbare Richtlinien

Benutzer können zur Laufzeit Folgendes festlegen:

Tiefe (Depth): Maximale Anzahl an Schlussfolgerungsschritten (1–10), steuert die logische Komplexität.
Breite (Width): Anzahl paralleler Retrieval-Quellen (5–100+), beeinflusst die Informationsabdeckung.
Latenzbudget (Latency Budget): Feste Frist (30 s – 30 min), mit automatischem Fallback bei Zeitüberschreitung.

Beispiel: Ein schlanker Modus (Tiefe=2, Breite=10, Latenz=2 min) eignet sich für Produktvergleiche; ein Tiefenmodus (Tiefe=8, Breite=50, Latenz=20 min) wird für die Recherche wissenschaftlicher Literatur verwendet.

3. Hybrides Retrieval und Neuplanungsmechanismus

Das anfängliche Retrieval verwendet eine hybride HyDE + Vektor + Keyword-Strategie.
Wenn eine kritische Teilaufgabe fehlschlägt (z. B. wenn der Finanzbericht eines Unternehmens nicht gefunden wird), wird eine Backtrack-Rewrite-Retry-Schleife ausgelöst.
Unterstützt vom Benutzer hochgeladene Dateien als „Ankerwissen“, um die Retrieval-Richtung zu steuern.

4. Open Source und selbst hostbar

Der Code wird auf GitHub gehostet und unterstützt die Ein-Klick-Bereitstellung mit Docker.
Kompatibel mit gängigen LLMs (z. B. GPT-4o, Claude 3.5, DeepSeek-R1) über einen einheitlichen MCP-Adapter.
Das Ausgabeformat ist Markdown + JSON, was die Integration mit Notion, Obsidian oder internen Systemen erleichtert.

Vergleich mit Deep Research

Dimension	OpenAI Deep Research	Open Deep Wide Research
Zugänglichkeit	Beschränkt auf ChatGPT-Abonnenten	Open-Source, selbst hostbar
Tool-Erweiterung	Geschlossen (nur von OpenAI bereitgestellt)	MCP-kompatibel, jedes Tool ist per Plug-in integrierbar
Kontrollgranularität	Feste Richtlinie	Anpassbar über drei Parameter: Tiefe/Breite/Latenz
Datenhoheit	Abhängig von der OpenAI Cloud	Unterstützt private Wissensdatenbanken und lokale Ausführung
Ausgabeexport	Nur innerhalb von ChatGPT	Unterstützt API-, JSON- und Markdown-Export

Handlungsaufforderung: Erleben Sie die Fähigkeiten von ODWR jetzt

Wir haben eine vereinfachte Version von ODWR auf der puppyone-Plattform integriert, mit der Benutzer schnell unternehmenstaugliche agentenbasierte RAG-Anwendungen erstellen können:

Laden Sie technische Dokumente hoch, um automatisch Wettbewerbsanalysen zu erstellen.
Verbinden Sie interne Datenbanken, um „Abfragen in natürlicher Sprache + ergänzende externe Recherchen“ zu ermöglichen.
Setzen Sie es als Kundenservice-Bot ein, der automatisch Richtliniendokumente und Benutzerhandbücher zitiert.

puppyone bietet eine kostenlose Testversion und einen Professional-Plan für Team-Kollaboration und Szenarien mit hoher Parallelität. Besuchen Sie https://www.puppyone.ai/, um Ihre Reise mit agentenbasiertem RAG zu beginnen.

FAQ

F1: Kann ODWR Deep Research ersetzen? Funktional kann es über 80 % der Anwendungsfälle abdecken und eignet sich besonders für Unternehmen, die Datenschutz, Kostenkontrolle oder benutzerdefinierte Tools benötigen. Bei extrem komplexen Aufgaben, die auf proprietäre Modelle von OpenAI (wie o3) angewiesen sind, kann die Leistung jedoch etwas geringer ausfallen.

F2: Sind Programmierkenntnisse für die Nutzung erforderlich? Nicht-technische Benutzer können Aufgaben-Templates über die grafische Benutzeroberfläche von puppyone konfigurieren, während Entwickler das Verhalten des Agenten über die MCP-API tiefgreifend anpassen können.

F3: Wie kann ich die Kosten kontrollieren? Mit ODWR können Sie den maximalen Token-Verbrauch, Limits für Tool-Aufrufe und Zeitüberschreitungsschwellen festlegen. Es unterstützt auch den Wechsel zu schlankeren Modellen (wie o4-mini oder DeepSeek-Lite), um die Inferenzkosten erheblich zu senken.

Agentic RAG

Agentisches RAG für Deep Research: Architektur, Mechanismen und Engineering‑Praktiken

Dieser Artikel stellt ein auf Tiefenrecherche ausgerichtetes Agentic-RAG-System vor, das autonom plant, iterativ Informationen abruft, quellenübergreifend validiert und strukturierte Berichte erstellt, um Rechercheaufgaben auf Expertenniveau in 2 bis 4 Minuten zu erledigen. Er beschreibt den Workflow des Systems, seine dynamische Reasoning-Engine, die Leistung bei Benchmarks wie Humanity’s Last Exam (21,1 %) und SimpleQA (93,9 %), behandelt aber auch Herausforderungen bei der Bereitstellung und stellt eine Open-Source-Implementierung vor.

Ollie @puppyone27. Okt. 2025

Agentic RAG

Open Deep Wide Research: Eine universelle Agenten-Kollaborationsarchitektur für großskalige Informationsgewinnung

Dieser Artikel stellt eine neuartige Agentic-RAG-Architektur vor, die dedizierte virtuelle Cloud-Maschinen und die Zusammenarbeit von Allzweck-Agenten nutzt, um umfangreiche Recherchen zu automatisieren. Dabei werden auch technische Herausforderungen wie Latenz, Ressourcenplanung und Kostenvorhersehbarkeit behandelt.

Ollie @puppyone26. Okt. 2025

Agentic RAG

Wie LLM-Agenten-Architekturen funktionieren: Vom Gedächtnis zur Handlung in KI-Systemen

Erfahren Sie, wie LLM-Agenten-Architekturen Agentic RAG und dynamische Kontextbasen nutzen, um sich von passiven Chatbots zu autonomen KI-Systemen zu entwickeln, die planen, sich erinnern und handeln – unterstützt durch Infrastruktur wie Puppyone.ai.

Ollie @puppyone30. Dez. 2025

Aufbau eines anpassbaren, skalierbaren agentenbasierten RAG: Von Deep Research zu Open Deep Wide Research

Abstract

Problemhintergrund: Die evolutionären Engpässe von RAG

Methodik: Destillation der Kernmechanismen von Deep Research

Implementierung: Die Architektur von Open Deep Wide Research

1. MCP-kompatibler Agenten-Kern

2. Dreidimensional anpassbare Richtlinien

3. Hybrides Retrieval und Neuplanungsmechanismus

4. Open Source und selbst hostbar

Vergleich mit Deep Research

Handlungsaufforderung: Erleben Sie die Fähigkeiten von ODWR jetzt

FAQ

Weiterlesen

Agentisches RAG für Deep Research: Architektur, Mechanismen und Engineering‑Praktiken

Open Deep Wide Research: Eine universelle Agenten-Kollaborationsarchitektur für großskalige Informationsgewinnung

Wie LLM-Agenten-Architekturen funktionieren: Vom Gedächtnis zur Handlung in KI-Systemen