Construindo um RAG Agêntico Ajustável e Escalável: Do Deep Research ao Open Deep Wide Research

27 de outubro de 2025Ollie @PuppyAgenrt

Resumo

Em 2025, a Geração Aumentada por Recuperação (RAG) está passando por uma mudança de paradigma, de "pipelines estáticos" para "agentes autônomos". O Deep Research da OpenAI demonstra o potencial dessa direção, comprimindo tarefas de pesquisa complexas em minutos por meio de planejamento multi-etapas, uso de ferramentas e raciocínio dinâmico. No entanto, sua arquitetura fechada e estratégias fixas têm dificuldade em atender às demandas empresariais por controlabilidade, eficiência de custos e soberania de dados. Este artigo apresenta o Open Deep Wide Research (ODWR) — um framework RAG Agêntico de código aberto, compatível com MCP, que suporta o ajuste de políticas em tempo de execução. Ele visa replicar as capacidades centrais do Deep Research, ao mesmo tempo que oferece aos desenvolvedores controle granular sobre profundidade, largura e latência.


Contexto do Problema: Os Gargalos Evolutivos do RAG

Os sistemas RAG tradicionais usam um pipeline linear de "recuperar → reclassificar → gerar", que é adequado para responder a perguntas factuais, mas falha nos seguintes cenários:

  • Raciocínio multi-salto (multi-hop): Por exemplo, "Compare as estratégias de código aberto de três empresas de IA de 2024 a 2025 e seu impacto no ecossistema de desenvolvedores."
  • Fusão de dados heterogêneos: Requer a análise simultânea de páginas da web, whitepapers técnicos em PDF e relatórios CSV enviados pelo usuário.
  • Ajuste dinâmico de tarefas: Quando os resultados da recuperação inicial são de baixa qualidade, o sistema não consegue corrigir autonomamente as consultas ou trocar de fontes de dados.

O Deep Research da OpenAI aborda esses problemas ao introduzir uma arquitetura agêntica: ele decompõe tarefas em sub-objetivos, chama ferramentas de navegador e Python, ajusta estratégias em tempo real e gera relatórios estruturados com citações. Esse design valida a viabilidade do RAG Agêntico, mas também expõe limitações importantes: modelos de caixa-preta, ausência de toolchains personalizados e falta de interfaces para agendamento de recursos.


Metodologia: Extraindo Mecanismos Centrais do Deep Research

Analisamos as descrições técnicas públicas do Deep Research (OpenAI, 2025) e extraímos três princípios de design reutilizáveis:

  1. Planejamento hierárquico de tarefas: Traduzir as instruções do usuário em um caminho de pesquisa executável (por exemplo, "identificar concorrentes → coletar parâmetros → validar de forma cruzada → gerar tabela de comparação").
  2. Execução colaborativa de ferramentas: Integrar navegadores web, interpretadores de código e analisadores de arquivos para formar um ciclo fechado.
  3. Resultados baseados em evidências: Cada conclusão é vinculada à sua fonte original, apoiando a rastreabilidade e a verificação.

Esses mecanismos podem ser padronizados e encapsulados por meio do Model Context Protocol (MCP). O MCP define os protocolos para passagem de contexto, sincronização de estado e recuperação de erros entre agentes e ferramentas, permitindo que diferentes componentes (como LLMs, crawlers e bancos de dados) sejam plug-and-play.


Implementação: A Arquitetura do Open Deep Wide Research

Com base nesses insights, desenvolvemos o Open Deep Wide Research (ODWR), um sistema RAG Agêntico de código aberto e auto-hospedável com as seguintes características:

1. Núcleo de Agente Compatível com MCP

  • O controlador do agente adere à especificação do MCP, suportando o carregamento dinâmico de ferramentas (por exemplo, navegador Selenium, analisador de PDF, motor de consulta SQL).
  • O contexto é passado como JSON estruturado, incluindo o status da tarefa, URLs visitadas, trechos citados e pontuações de confiança.

2. Políticas Ajustáveis Tridimensionais

Os usuários podem especificar em tempo de execução:

  • Profundidade: Máximo de etapas de raciocínio (1–10), controlando a complexidade lógica.
  • Largura: Número de fontes de recuperação paralelas (5–100+), afetando a cobertura da informação.
  • Orçamento de Latência: Prazo final rígido (30s–30min), com fallback automático em caso de timeout.

Exemplo: Um modo leve (Profundidade=2, Largura=10, Latência=2min) é adequado para comparações de produtos; um modo profundo (Profundidade=8, Largura=50, Latência=20min) é usado para revisões de literatura científica.

3. Mecanismo de Recuperação Híbrida e Replanejamento

  • A recuperação inicial usa uma estratégia híbrida HyDE + vetor + palavra-chave.
  • Se uma subtarefa crítica falhar (por exemplo, o relatório financeiro de uma empresa não for encontrado), um ciclo de retroceder-reescrever-tentar novamente é acionado.
  • Suporta arquivos enviados pelo usuário como "conhecimento âncora" para guiar a direção da recuperação.

4. Código Aberto e Auto-Hospedável

  • O código está hospedado no GitHub e suporta implantação com um clique usando Docker.
  • Compatível com os principais LLMs (por exemplo, GPT-4o, Claude 3.5, DeepSeek-R1) por meio de um adaptador MCP unificado.
  • O formato de saída é Markdown + JSON, facilitando a integração com Notion, Obsidian ou sistemas internos.

Comparação com o Deep Research

DimensãoOpenAI Deep ResearchOpen Deep Wide Research
AcessibilidadeLimitado a assinantes do ChatGPTCódigo aberto, auto-hospedável
Extensão de FerramentasFechada (apenas as fornecidas pela OpenAI)Compatível com MCP, qualquer ferramenta é conectável
Granularidade de ControlePolítica fixaAjustável por três parâmetros: Profundidade/Largura/Latência
Soberania de DadosDepende da nuvem da OpenAISuporta bases de conhecimento privadas e execução local
Exportação de SaídaApenas dentro do ChatGPTSuporta exportação via API, JSON e Markdown

Chamada para Ação: Experimente as Capacidades do ODWR Agora

Integramos uma versão simplificada do ODWR na plataforma puppyone, permitindo que os usuários criem rapidamente aplicações de RAG Agêntico de nível empresarial:

  • Faça upload de documentos técnicos para gerar automaticamente relatórios de análise competitiva.
  • Conecte-se a bancos de dados internos para permitir "consultas em linguagem natural + pesquisa externa complementar."
  • Implante como um bot de atendimento ao cliente que cita automaticamente documentos de políticas e manuais do usuário.

O puppyone oferece uma avaliação gratuita e um plano Profissional para colaboração em equipe e cenários de alta concorrência. Visite https://www.puppyone.ai/ para iniciar sua jornada com o RAG Agêntico.


FAQ

P1: O ODWR pode substituir o Deep Research? Funcionalmente, ele pode cobrir mais de 80% de seus casos de uso e é especialmente adequado para empresas que exigem privacidade de dados, controle de custos ou ferramentas personalizadas. No entanto, para tarefas extremamente complexas que dependem dos modelos proprietários da OpenAI (como o o3), o desempenho pode ser ligeiramente inferior.

P2: É necessário ter conhecimento de programação para usá-lo? Usuários não técnicos podem configurar modelos de tarefas por meio da interface gráfica do puppyone, enquanto desenvolvedores podem personalizar profundamente o comportamento do agente via API do MCP.

P3: Como posso controlar os custos? O ODWR permite que você defina o consumo máximo de tokens, limites de chamadas de ferramentas e limites de tempo de espera (timeout). Ele também suporta a troca para modelos mais leves (como o4-mini ou DeepSeek-Lite) para reduzir significativamente os custos de inferência.