
Quando planos, artefatos intermediários e decisões são capturados em arquivos—plan.md, scratch.md, decisions.json, trace.log—eles se tornam a fonte da verdade do raciocínio em vez de uma memória que se desvanece na janela de tokens. Arquivos trazem versionamento, diffs e pontos de verificação. Você pode revisar como um plano evoluiu, reverter ramos ruins e reproduzir uma execução a partir de um estado conhecido. O sistema de arquivos é a memória de trabalho do agente que você pode auditar, não um fio de prompt invisível.
O ensaio de Jakob Emmerling do início de 2026 faz o caso conceitual para agentes “filesystem-first”, ilustrando padrões como e-mail-como-diretórios e operações POSIX read/write/list/move como ações naturais. Veja “FUSE is All You Need – Giving agents access to anything via filesystems”. Para trade-offs de arquitetura: How LLM Agent Architectures Work.
O ganho prático é reprodutibilidade: arquivos como decisions.json e trace.log dão rastros determinísticos do que aconteceu e por quê. Também melhoram a colaboração entre engenheiros e agentes—humanos podem ler plan.md, editar uma seção e deixar o agente continuar. Nenhuma ferramenta especial necessária.
Workspace concreto: /workspace/repoA, repoB/docs, patterns, plans/plan.md, scratch/scratch.md, logs/trace.log, state/decisions.json. Agentes usam operações POSIX familiares (ls, grep, mv/cp, echo >>, diff/patch). Ciclo de vida: (1) Criar ou carregar plan.md com objetivos e restrições. (2) Iterar em scratch.md: tentar trechos, capturar descobertas e anotar bloqueios. (3) Registrar decisões em decisions.json com justificativa e timestamps. (4) Registrar ações em trace.log com IDs de ação do agente. (5) Promover artefatos validados e abrir PR via MCP. Funciona bem para conhecimento de engenharia em múltiplos repos porque agentes podem “pensar” em arquivos e operar entre repos sem adaptadores sob medida; o sistema de arquivos oferece uma abstração e o MCP expõe sistemas externos por uma interface padronizada.
Trate o MCP como a ponte padronizada para rastreadores de issues, CI, armazenamentos de documentos e serviços internos. Referências: especificação aniversário MCP, atualização de autorização MCP, execução de código com MCP (Anthropic), documentação MCP JetBrains.
Filesystem-first não significa sem regras. Projete com menor privilégio: montagens por tarefa, ACLs em nível de caminho e logs de auditoria, controles em nível de SO (SELinux, AppArmor, Landlock). Local-first/on-prem ajuda com residência e conformidade. Alinhe os escopos MCP ao mesmo modelo de menor privilégio da camada de sistema de arquivos.
Rastreamento POSIX, métricas principais (taxa de sucesso, latência, reprodutibilidade, auditabilidade), metodologia de benchmark: comparar agente filesystem-first com cadeia apenas API/MCP. Mais contexto sobre a “camada de contexto” em sistemas de agentes: Building a RAG Model That Scales.
O FUSE adiciona mediação em espaço de usuário (mais CPU e latência). Domínios de streaming ou transacionais podem ainda preferir SDKs/APIs diretos. Padrão híbrido: sistema de arquivos para plan/scratch/state e MCP para chamadas estruturadas e transacionais.
Divulgação: Puppyone é nosso produto.
Uma base de contexto governada pode sustentar esta arquitetura: conhecimento empresarial como “Know-How” estruturado (JSON/Graph), indexação híbrida, implantação local via Docker. Context Base da Puppyone. How Agentic Process Automation Is Transforming Enterprise Operations in 2026.
Comece pequeno: montagem FUSE local com plan/scratch em dois repos, conectores MCP para PRs/issues, rastreamento POSIX. Defina montagens de menor privilégio e ACLs em nível de caminho cedo. Referências: FUSE is All You Need, AgentFS (Penberg), Turso AgentFS FUSE, aniversário MCP, Anthropic MCP, JetBrains MCP.
O FUSE adiciona latência moderada; cargas de agentes são tipicamente dominadas por leitura com escritas em rajadas. O cache de páginas do kernel mitiga o overhead após as leituras iniciais. Pilotos Turso mostram latência <10 ms em tarefas de engenharia como grep entre repos—negligível em relação à inferência LLM. Append em lote ou partições scratch respaldadas por RAM absorvem picos de escrita. Um tradeoff de latência de 5–15% é justificado pela rastreabilidade determinística (trace.log) e fluxos reproduzíveis a partir de checkpoints de plan.md.
Escolha uma tarefa contida em dois repos (ex.: documentar um fluxo de auth). Monte apenas esses repos mais os diretórios vazios plans/, scratch/, logs/ com fusepy ou fuse-turso localmente. O agente inicializa plan.md, itera em scratch.md e grava em trace.log. Adicione um conector MCP mínimo para PRs do GitHub. Tudo em um laptop de desenvolvimento; valide reprodutibilidade e ganhos de depuração em duas semanas—sem alterações de produção.
Para streaming de alta frequência (dados de mercado em tempo real), transações ACID críticas (pagamentos) ou tarefas de etapa única sem estado (resumo de URL). Esses casos exigem latência sub-milissegundo ou garantias transacionais nativas que FUSE não pode oferecer. Use padrão híbrido: sistema de arquivos para plan/scratch/state e chamadas sensíveis à latência via ferramentas MCP com escopo. Regra prática: se você gostaria de fazer git diff plan.md amanhã para auditar uma decisão, filesystem-first agrega valor.