FUSE AI Agents 2026: 신뢰할 수 있는 추론을 위한 Plan/Scratch

2026년 1월 24일Ollie @puppyone

핵심 요약

FUSE AI Agents 2026 plan/scratch 워크플로

  • plan.md, scratch.md, decisions.json, trace.log를 통해 롱 컨텍스트를 외부화하면 다단계 추론이 안정되고 디버깅이 일상화된다.
  • FUSE 기반 마운트로 에이전트가 표준 POSIX 시맨틱(ls/grep/mv/append)으로 동작해 맞춤 도구 래퍼를 줄이고 재현성을 높인다.
  • MCP는 엔터프라이즈 시스템으로의 표준 브릿지, 파일시스템은 통합 로컬 워크스페이스를 제공해 함께 거버넌스·관측 가능한 워크플로를 만든다.
  • 로컬 퍼스트/온프레미스 배포는 규정 준수·데이터 거주와 맞고, 태스크별 마운트와 경로 수준 ACL로 최소 권한을 강화할 수 있다.
  • 벤치마크는 아직 초기 단계다. 성능 주장은 가설로 보고 평가 방법과 관측 가능성을 우선하자.

롱 컨텍스트에서 파일이 일시적 프롬프트를 이기는 이유

계획·중간 산출물·결정이 파일(plan.md, scratch.md, decisions.json, trace.log)에 담기면 토큰 창 안에서 사라지는 기억이 아니라 추론의 ‘진실의 원천’이 된다. 파일은 버전 관리, diff, 체크포인트를 제공한다. 계획이 어떻게 바뀌었는지 보고, 잘못된 브랜치를 롤백하고, 알려진 상태에서 실행을 재현할 수 있다. 파일시스템은 감사할 수 있는 에이전트의 작업 기억이고, 추측만 가능한 보이지 않는 프롬프트 스레드가 아니다.

Jakob Emmerling의 2026년 초 에세이는 ‘파일시스템 퍼스트’ 에이전트의 개념적 근거를 제시하며, 이메일을 디렉터리로 쓰는 패턴과 POSIX read/write/list/move를 자연스러운 에이전트 동작으로 보여 준다. 「FUSE is All You Need – Giving agents access to anything via filesystems」 참고. 거버넌스된 컨텍스트 레이어의 중요성은 How LLM Agent Architectures Work에서 다뤘다.

실무적 이점은 재현성이다. decisions.json, trace.log 같은 파일이 무슨 일이 왜 일어났는지 결정론적 추적을 준다. 엔지니어와 에이전트 간 협업도 좋아진다—사람이 plan.md를 읽고 섹션을 수정한 뒤 에이전트가 이어가면 된다. 별도 도구 불필요.

실행 예 — 다중 리포지터리 엔지니어링 지식과 plan/scratch 워크플로

구체적 워크스페이스: /workspace/repoA, repoB/docs, patterns, plans/plan.md, scratch/scratch.md, logs/trace.log, state/decisions.json. 에이전트는 익숙한 POSIX 연산(ls, grep, mv/cp, echo >>, diff/patch)을 쓴다. 생명주기: (1) 목표와 제약으로 plan.md 생성·로드. (2) scratch.md에서 반복: 스니펫 시도, 발견 기록, 블로커 메모. (3) decisions.json에 결정·근거·타임스탬프 기록. (4) trace.log에 액션·에이전트 액션 ID 기록. (5) 검증된 산출물을 스크래치에서 해당 리포 디렉터리로 승격하고 MCP로 PR 오픈. 여러 리포에 걸친 엔지니어링 지식에 잘 맞는 이유는, 에이전트가 ‘파일로 생각’하고 전용 어댑터 없이 리포를 넘나들 수 있기 때문이다. 파일시스템이 하나의 추상화를 제공하고 MCP 서버가 표준 인터페이스로 외부 시스템(이슈 트래커, CI, 문서 저장소)을 노출한다.

FUSE AI 에이전트와 MCP 연동 구현 패턴

  • SQLite 백엔드 로컬 전용 FUSE: 개발 머신·소규모 파일럿에 적합. AgentFS 제안(Penberg).
  • DB 백엔드 가상 FS(로컬 SQLite, 이후 Supabase 등): Turso 「AgentFS FUSE」 노트.
  • 오브젝트 스토어 백엔드 AgentFS: 대규모 조직용, 스토리지 분리 후 캐시 가상 파일시스템 마운트.

MCP는 이슈 트래커, CI, 문서 저장소, 내부 서비스로 가는 표준 브릿지로 둔다. 참고: MCP 1주년 스펙, MCP 인가 업데이트, Anthropic MCP 코드 실행, JetBrains MCP 문서.

거버넌스, 샌드박싱, 규정 준수

파일시스템 퍼스트는 무제한이 아니다. 최소 권한으로 설계: 태스크별 마운트, 경로 수준 ACL·감사 로그, OS 수준 제어(SELinux, AppArmor, Landlock). 로컬 퍼스트/온프레미스는 데이터 거주·규정 준수에 유리. MCP 스코프를 파일시스템 계층과 동일한 최소 권한 모델에 맞춘다.

관측 가능성과 평가

POSIX 추적, 핵심 지표(성공률, 지연, 재현성, 감사 가능성), 벤치마크 방법: 파일시스템 퍼스트 에이전트 vs API/MCP 전용 툴체인을 다단계 엔지니어링 태스크로 비교. 에이전트의 ‘컨텍스트 레이어’ 더 보기: Building a RAG Model That Scales.

한계와 API가 유리한 경우

FUSE는 유저스페이스 매개를 추가해 CPU·지연이 늘 수 있다. 스트리밍·트랜잭션 도메인(고빈도 메시징, 금융 거래)은 직접 SDK/API가 유리할 수 있다. 하이브리드: 파일시스템은 plan/scratch/state, MCP는 구조화·트랜잭션 호출.

컨텍스트 베이스가 들어가는 자리

고지: Puppyone은 자사 제품입니다.

거버넌스된 컨텍스트 베이스는 구조화된 ‘Know-How’(JSON/Graph)로 엔터프라이즈 지식 저장, 하이브리드 인덱싱·결정론적 검색, Docker 로컬 배포로 이 아키텍처를 받칠 수 있다. Puppyone 컨텍스트 베이스. How Agentic Process Automation Is Transforming Enterprise Operations in 2026.

다음 단계와 자료

작게 시작: 2개 리포에 로컬 FUSE 마운트·plan/scratch, PR/이슈용 MCP 커넥터, POSIX 추적. 최소 권한 마운트·경로 수준 ACL을 일찍 정의. 참고: FUSE is All You Need, AgentFS(Penberg), Turso AgentFS FUSE, MCP 주년, Anthropic MCP, JetBrains MCP.

FAQ

Q1: FUSE 오버헤드가 에이전트 성능에 크게 영향을 주나요?

FUSE는 약간의 지연을 더하지만 에이전트 워크로드는 보통 읽기 위주·버스트 쓰기다. 커널 페이지 캐시로 초기 읽기 이후 오버헤드는 완화된다. Turso 파일럿에서는 cross-repo grep 같은 엔지니어링 태스크에 <10ms 지연—LLM 추론에 비해 무시할 수준. trace.log의 결정론적 추적성과 plan.md 체크포인트에서 재생 가능한 워크플로로 5–15% 지연 트레이드오프는 정당화된다.

Q2: 인프라 대개편 없이 파일시스템 퍼스트 파일럿을 시작하려면?

2개 리포로 제한된 태스크(예: 인증 플로우 문서화)를 고른다. 해당 리포와 빈 plans/, scratch/, logs/만 fusepy 또는 fuse-turso로 로컬 마운트. 에이전트가 plan.md 초기화, scratch.md에서 반복, trace.log에 기록. GitHub PR용 최소 MCP 커넥터 추가. 전부 개발자 랩톱에서 실행하고 2주 안에 재현성·디버깅 이득 검증. 프로덕션 변경 불필요.

Q3: 언제 파일시스템 퍼스트를 피하고 직접 API를 써야 하나요?

고빈도 스트리밍(실시간 시장 데이터), ACID 크리티컬 트랜잭션(결제), 무상태 단일 단계 태스크(URL 요약)에서는 피한다. 하이브리드가 자주 이긴다: 파일시스템은 plan/scratch/state, 지연에 민감한 호출은 스코프된 MCP 도구로. 경험 법칙: 내일 결정을 감사하려고 git diff plan.md를 하고 싶다면 파일시스템 퍼스트가 가치를 준다.