
프로덕션에서 AI 에이전트가 실패하는 이유는 모델이 충분히 똑똑하지 않아서만은 아닙니다. 모델 주변 시스템이 잘못된 컨텍스트, 오래된 컨텍스트, 경계 없는 컨텍스트를 전달할 때 문제가 시작됩니다.
많은 팀이 아직도 AI 거버넌스를 eval, prompt, 모델 안전성 관점에서만 봅니다. agentic system에서는 그걸로 부족합니다.
비용이 큰 리스크는 보통 모델 주변에 있습니다.
그래서 컨텍스트 레이어와 실행 레이어를 모두 거버넌스 대상으로 삼아야 합니다. 이 관점은 NIST AI Risk Management Framework와도 잘 맞습니다.
사람들이 "에이전트에 컨텍스트가 필요하다"고 말할 때, 보통 retrieval 결과나 채팅 기록, memory를 떠올립니다. 하지만 그것만으로는 좁습니다.
비즈니스 컨텍스트에는 다음이 포함됩니다.
에이전트에게 contextual intelligence란 다음을 의미합니다.
| 컨텍스트 종류 | 포함 내용 | 흔한 실패 | 던져야 할 질문 |
|---|---|---|---|
| 비즈니스 컨텍스트 | 목표, 정책, SOP, 승인 규칙 | 글은 따르지만 실제 업무 규칙은 놓친다 | 여기서 유효한 행동은 무엇인가 |
| 운영 컨텍스트 | 환경, 계정 상태, 쿼터, 장애, 워크플로 상태 | 맞는 행동을 틀린 환경에서 실행한다 | 지금 무엇이 사실인가 |
| 정책 및 권한 컨텍스트 | scope, entitlement, tool permission, 위험 등급 | 기술적으로 가능하지만 논리적으로 금지된 호출 | 이 에이전트는 무엇을 할 수 있는가 |
| 출처 및 신선도 컨텍스트 | source, owner, version, timestamp, trust level | 오래되거나 약한 정보가 판단을 이끈다 | 왜 지금 이 정보를 믿을 수 있는가 |
모든 컨텍스트를 같은 수준으로 다뤄서는 안 됩니다.
verifiedinternalexternalunknown중요한 점은 낮은 신뢰도의 컨텍스트가 자동으로 행동 근거가 되지 않게 하는 것입니다.
에이전트가 무엇을 했는지만 알고 무엇을 봤는지 모르면 실질적인 audit trail이 아닙니다.
프로덕션에서 흔한 문제는 "답이 없음"보다 "오래되거나 충돌하는 답이 남아 있음"입니다.
프롬프트 지시는 거버넌스가 아닙니다. 데이터 수정, 외부 전송, 파일 내보내기 같은 행동은 모델 바깥의 결정 로직에서 최종 승인돼야 합니다.
{
"source_id": "refund_policy_v17",
"owner": "finops",
"trust_level": "verified",
"approved_at": "2026-04-10T10:20:00Z",
"expires_at": "2026-07-10T00:00:00Z",
"audience": ["support-agent", "billing-agent"],
"risk_class": "high"
}
체크해야 할 것은 다섯 가지입니다.
retrieve context
-> check provenance
-> check freshness
-> check authorization
-> check for conflicts
-> allow, block, or escalate
함께 읽기 좋은 글은 AI Pipeline Workflow 와 Version Control for AI Agent Context 입니다.
많은 에이전트 배포는 컨텍스트 조립에서 무너집니다. 정책은 한 시스템, 운영 사실은 다른 시스템, 승인 규칙은 또 다른 시스템에 흩어져 있기 때문입니다.
governed context layer가 있으면,
기술 배경으로는 Ultimate Guide to Agent Context Base: Hybrid Indexing 와 Context Engineering: When RAG Is Not Enough 가 가장 가깝습니다.
즉흥적 retrieval이 아니라 통제된 context가 필요하다면 puppyone을 사용하세요Get started전자는 모델 리스크와 통제 전반을 다루고, 후자는 에이전트가 어떤 정보를 어떤 조건에서 사용할 수 있는지에 집중합니다.
에이전트는 사실을 만들어내는 것만이 아니라, 그 사실을 둘러싼 업무 규칙을 놓쳐서도 실패하기 때문입니다.
아닙니다. retrieval은 정보를 전달할 뿐, 그 정보가 적절하고 최신이며 안전한지까지 판단해주지는 않습니다.