Construindo um RAG Agêntico Ajustável e Escalável: Do Deep Research ao Open Deep Wide Research

27 de outubro de 2025Ollie @PuppyAgenrt

Resumo

Em 2025, a Geração Aumentada por Recuperação (RAG) está passando por uma mudança de paradigma, de "pipelines estáticos" para "agentes autônomos". O Deep Research da OpenAI demonstra o potencial dessa direção, comprimindo tarefas de pesquisa complexas em minutos por meio de planejamento multi-etapas, uso de ferramentas e raciocínio dinâmico. No entanto, sua arquitetura fechada e estratégias fixas têm dificuldade em atender às demandas empresariais por controlabilidade, eficiência de custos e soberania de dados. Este artigo apresenta o Open Deep Wide Research (ODWR) — um framework RAG Agêntico de código aberto, compatível com MCP, que suporta o ajuste de políticas em tempo de execução. Ele visa replicar as capacidades centrais do Deep Research, ao mesmo tempo que oferece aos desenvolvedores controle granular sobre profundidade, largura e latência.

Contexto do Problema: Os Gargalos Evolutivos do RAG

Os sistemas RAG tradicionais usam um pipeline linear de "recuperar → reclassificar → gerar", que é adequado para responder a perguntas factuais, mas falha nos seguintes cenários:

Raciocínio multi-salto (multi-hop): Por exemplo, "Compare as estratégias de código aberto de três empresas de IA de 2024 a 2025 e seu impacto no ecossistema de desenvolvedores."
Fusão de dados heterogêneos: Requer a análise simultânea de páginas da web, whitepapers técnicos em PDF e relatórios CSV enviados pelo usuário.
Ajuste dinâmico de tarefas: Quando os resultados da recuperação inicial são de baixa qualidade, o sistema não consegue corrigir autonomamente as consultas ou trocar de fontes de dados.

O Deep Research da OpenAI aborda esses problemas ao introduzir uma arquitetura agêntica: ele decompõe tarefas em sub-objetivos, chama ferramentas de navegador e Python, ajusta estratégias em tempo real e gera relatórios estruturados com citações. Esse design valida a viabilidade do RAG Agêntico, mas também expõe limitações importantes: modelos de caixa-preta, ausência de toolchains personalizados e falta de interfaces para agendamento de recursos.

Metodologia: Extraindo Mecanismos Centrais do Deep Research

Analisamos as descrições técnicas públicas do Deep Research (OpenAI, 2025) e extraímos três princípios de design reutilizáveis:

Planejamento hierárquico de tarefas: Traduzir as instruções do usuário em um caminho de pesquisa executável (por exemplo, "identificar concorrentes → coletar parâmetros → validar de forma cruzada → gerar tabela de comparação").
Execução colaborativa de ferramentas: Integrar navegadores web, interpretadores de código e analisadores de arquivos para formar um ciclo fechado.
Resultados baseados em evidências: Cada conclusão é vinculada à sua fonte original, apoiando a rastreabilidade e a verificação.

Esses mecanismos podem ser padronizados e encapsulados por meio do Model Context Protocol (MCP). O MCP define os protocolos para passagem de contexto, sincronização de estado e recuperação de erros entre agentes e ferramentas, permitindo que diferentes componentes (como LLMs, crawlers e bancos de dados) sejam plug-and-play.

Implementação: A Arquitetura do Open Deep Wide Research

Com base nesses insights, desenvolvemos o Open Deep Wide Research (ODWR), um sistema RAG Agêntico de código aberto e auto-hospedável com as seguintes características:

1. Núcleo de Agente Compatível com MCP

O controlador do agente adere à especificação do MCP, suportando o carregamento dinâmico de ferramentas (por exemplo, navegador Selenium, analisador de PDF, motor de consulta SQL).
O contexto é passado como JSON estruturado, incluindo o status da tarefa, URLs visitadas, trechos citados e pontuações de confiança.

2. Políticas Ajustáveis Tridimensionais

Os usuários podem especificar em tempo de execução:

Profundidade: Máximo de etapas de raciocínio (1–10), controlando a complexidade lógica.
Largura: Número de fontes de recuperação paralelas (5–100+), afetando a cobertura da informação.
Orçamento de Latência: Prazo final rígido (30s–30min), com fallback automático em caso de timeout.

Exemplo: Um modo leve (Profundidade=2, Largura=10, Latência=2min) é adequado para comparações de produtos; um modo profundo (Profundidade=8, Largura=50, Latência=20min) é usado para revisões de literatura científica.

3. Mecanismo de Recuperação Híbrida e Replanejamento

A recuperação inicial usa uma estratégia híbrida HyDE + vetor + palavra-chave.
Se uma subtarefa crítica falhar (por exemplo, o relatório financeiro de uma empresa não for encontrado), um ciclo de retroceder-reescrever-tentar novamente é acionado.
Suporta arquivos enviados pelo usuário como "conhecimento âncora" para guiar a direção da recuperação.

4. Código Aberto e Auto-Hospedável

O código está hospedado no GitHub e suporta implantação com um clique usando Docker.
Compatível com os principais LLMs (por exemplo, GPT-4o, Claude 3.5, DeepSeek-R1) por meio de um adaptador MCP unificado.
O formato de saída é Markdown + JSON, facilitando a integração com Notion, Obsidian ou sistemas internos.

Comparação com o Deep Research

Dimensão	OpenAI Deep Research	Open Deep Wide Research
Acessibilidade	Limitado a assinantes do ChatGPT	Código aberto, auto-hospedável
Extensão de Ferramentas	Fechada (apenas as fornecidas pela OpenAI)	Compatível com MCP, qualquer ferramenta é conectável
Granularidade de Controle	Política fixa	Ajustável por três parâmetros: Profundidade/Largura/Latência
Soberania de Dados	Depende da nuvem da OpenAI	Suporta bases de conhecimento privadas e execução local
Exportação de Saída	Apenas dentro do ChatGPT	Suporta exportação via API, JSON e Markdown

Chamada para Ação: Experimente as Capacidades do ODWR Agora

Integramos uma versão simplificada do ODWR na plataforma puppyone, permitindo que os usuários criem rapidamente aplicações de RAG Agêntico de nível empresarial:

Faça upload de documentos técnicos para gerar automaticamente relatórios de análise competitiva.
Conecte-se a bancos de dados internos para permitir "consultas em linguagem natural + pesquisa externa complementar."
Implante como um bot de atendimento ao cliente que cita automaticamente documentos de políticas e manuais do usuário.

O puppyone oferece uma avaliação gratuita e um plano Profissional para colaboração em equipe e cenários de alta concorrência. Visite https://www.puppyone.ai/ para iniciar sua jornada com o RAG Agêntico.

FAQ

P1: O ODWR pode substituir o Deep Research? Funcionalmente, ele pode cobrir mais de 80% de seus casos de uso e é especialmente adequado para empresas que exigem privacidade de dados, controle de custos ou ferramentas personalizadas. No entanto, para tarefas extremamente complexas que dependem dos modelos proprietários da OpenAI (como o o3), o desempenho pode ser ligeiramente inferior.

P2: É necessário ter conhecimento de programação para usá-lo? Usuários não técnicos podem configurar modelos de tarefas por meio da interface gráfica do puppyone, enquanto desenvolvedores podem personalizar profundamente o comportamento do agente via API do MCP.

P3: Como posso controlar os custos? O ODWR permite que você defina o consumo máximo de tokens, limites de chamadas de ferramentas e limites de tempo de espera (timeout). Ele também suporta a troca para modelos mais leves (como o4-mini ou DeepSeek-Lite) para reduzir significativamente os custos de inferência.

Agentic RAG

RAG Agêntico para Pesquisa Profunda: Arquitetura, Mecanismos e Práticas de Engenharia

Este artigo apresenta um sistema RAG agêntico avançado para pesquisa que conclui tarefas de nível especialista em 2 a 4 minutos por meio de planejamento autônomo, busca iterativa e verificação de informações. Detalhamos o fluxo de trabalho do sistema, o motor de raciocínio dinâmico, o desempenho em benchmarks e a implementação de código aberto 'Deep Wide Research' da puppyone, abordando também os desafios de sua adoção.

Ollie @puppyone27 de out. de 2025

Agentic RAG

Open Deep Wide Research: Arquitetura de colaboração de agentes de uso geral para coleta de informação em larga escala

Este artigo explora uma nova arquitetura de RAG Agêntico que utiliza máquinas virtuais dedicadas na nuvem e colaboração multiagente para automatizar tarefas de pesquisa em larga escala, como comparações entre entidades, enquanto aborda desafios de engenharia em latência, agendamento de recursos e previsibilidade de custos.

Ollie @puppyone26 de out. de 2025

Agentic RAG

Como Funcionam as Arquiteturas de Agentes de LLM: Da Memória à Ação em Sistemas de IA

Descubra como arquiteturas de agentes LLM utilizam RAG Agêntico e bases de contexto dinâmicas para evoluir de chatbots passivos para sistemas de IA autônomos que planejam, lembram e agem — impulsionados por infraestruturas como a Puppyone.ai.

Ollie @puppyone30 de dez. de 2025

Construindo um RAG Agêntico Ajustável e Escalável: Do Deep Research ao Open Deep Wide Research

Resumo

Contexto do Problema: Os Gargalos Evolutivos do RAG

Metodologia: Extraindo Mecanismos Centrais do Deep Research

Implementação: A Arquitetura do Open Deep Wide Research

1. Núcleo de Agente Compatível com MCP

2. Políticas Ajustáveis Tridimensionais

3. Mecanismo de Recuperação Híbrida e Replanejamento

4. Código Aberto e Auto-Hospedável

Comparação com o Deep Research

Chamada para Ação: Experimente as Capacidades do ODWR Agora

FAQ

Leituras relacionadas

RAG Agêntico para Pesquisa Profunda: Arquitetura, Mecanismos e Práticas de Engenharia

Open Deep Wide Research: Arquitetura de colaboração de agentes de uso geral para coleta de informação em larga escala

Como Funcionam as Arquiteturas de Agentes de LLM: Da Memória à Ação em Sistemas de IA