자율 에이전트를 유용하게 만드는 것이 왜 그렇게 어려운가

2024년 9월 10일Guantum @puppyone founder

에이전트라는 용어는 2023년에 뜨거운 화제가 되었습니다. AutoGPT, 스탠포드 타운, BabyAGI 등 수많은 "LLM 기반 에이전트"에 대해 들어보셨을 겁니다. 이것들은 단순한 개념이 아니라 환경을 감지하고, 다음 단계를 계획하고, 작업을 수행할 수 있는 실제 에이전트입니다.

"이것이 바로 미래다!"라고 사람들은 외쳤습니다. puppyone가 설립된 것도 바로 이 시기였습니다. 그러나 사람들이 이러한 에이전트를 워크플로에 통합하기 시작하면서 예상보다 훨씬 더 어렵다는 것을 즉시 깨달았습니다.

요약하자면, 오늘날의 에이전트는 우리가 생각했던 것만큼 유용하지 않습니다.

자율 에이전트를 유용하게 만드는 것이 왜 그렇게 어려운가?

작년에 우리는 사용자에게 에이전트를 제공하고 주변 사람들을 인터뷰했습니다. 놀랍게도 에이전트에 가장 열성적인 사람들조차 일관된 답변을 내놓았습니다. 실제 협업에서는 "완전 자율 에이전트"를 사용하지 않는다는 것입니다.

에이전트 기능을 구매하는 의사 결정자들은 지속적인 우려에 직면합니다.

에이전트의 오류가 돌이킬 수 없는 손상을 초래할 경우 누가 책임을 지나요?

기업 환경에서는 에이전트에서 완전한 자율성과 완벽한 안정성을 모두 달성하기 어렵다는 것이 널리 받아들여지고 있습니다. 이 두 가지 특성 사이의 절충은 모든 회사 사용자가 답해야 하는 중요한 질문입니다. 우리의 현재 실제 사례에 따르면 기업들은 자율성보다 안정성을 우선시하는 경향이 있습니다.

자율 대 안정, AutoGPT, AutoGen, LangFlow, Flow, RPA

가상 시나리오를 생각해 보겠습니다. 에이전트가 매일 직원의 시간을 10분 절약할 수 있지만 회사에 500만 달러의 손실을 입힐 5%의 위험이 있다면 구매하시겠습니까?

두 가지 핵심 질문:

1. 어떤 경우에 에이전트의 실수 비용이 낮은가요?

2. 어떤 경우에 에이전트가 실수를 저질렀는지 확인하는 비용이 낮은가요?

이 두 가지 질문을 반복함으로써 에이전트를 위한 잠재적인 SaaS를 식별할 수 있습니다. RPA(로봇 프로세스 자동화) 및 Flow. 안정성을 보장하거나 엄격한 규칙을 통해 에이전트의 기능을 제한하기 때문에 구현에 자연스럽게 적합합니다. 이 접근 방식은 에이전트의 실수 비용을 최소화하고 프로세스 해석 가능성을 향상시켜 프로세스의 특정 단계에서 문제를 추적할 수 있도록 합니다.

그런데 이는 에이전트 적용 시나리오의 50% 이상이 RAG(검색 증강 생성) Q&A 및 간단한 CRUD 작업에 있는 이유를 설명하기도 합니다. 이러한 시나리오는 앞서 언급한 중요한 문제를 회피합니다.

에이전트의 기능은 어떤 방식으로 사용될 수 있나요?

앞서 언급한 두 가지 핵심 질문을 해결해야만 에이전트 제품이 진정한 PMF를 찾을 수 있습니다. 두 가지 예를 살펴보겠습니다.

Zapier (RPA 제품)

전형적인 RPA 제품인 Zapier는 에이전트 쪽으로 방향을 틀고 있습니다. 2023년 4월, Zapier의 에이전트는 한 문장(텍스트를 워크플로로)으로 고정된 워크플로를 생성하는 도구로 OpenAI 플러그인 스토어에 데뷔했습니다. 또한 2023년 11월 OpenAI의 DevDay에서도 소개되었습니다.

Zapier에서 LLM(대규모 언어 모델)은 에이전트라기보다는 RPA 워크플로 생성 코파일럿으로 기능합니다. LLM의 가치는 실시간 실행 결정을 내리는 것이 아니라 RPA 워크플로 생성을 단순화하는 데 있습니다. 대부분의 유료 사용자는 RPA가 처리할 수 있는 문제에 대한 해결책을 찾고 있으며, 이는 Zapier의 원래 포지셔닝인 "한 소프트웨어에서 다른 소프트웨어로 정보를 동기화하는 방법"과 일치합니다.

Make와 같이 본질적으로 RPA를 LLM 시대로 확장하는 유사한 제품이 많이 있습니다. 완전한 안정성과 오류 없는 작동을 제공하지만 자율성이 부족합니다.

Retool 워크플로 (플로우 제품)

잘 알려진 SaaS 회사인 Retool은 2023년 9월에 워크플로 제품을 출시했습니다. 이 제품은 로우코드 워크플로 편집에 중점을 둔 노코드 편집 프레임워크를 제공하며 RAG에 대한 특정 최적화를 포함합니다.

이 분야의 유사한 제품으로는 Dify, FastGPT, LangFlow, Flowise 등이 있습니다. 이러한 도구는 인터페이스를 통해 빠르고 쉬운 에이전트 편집을 가능하게 하며, "에이전트 행동"에 대한 RPA의 엄격한 제한과는 대조적입니다. 특정 단계에서 LLM을 통합하지만 대부분의 논리적 결정은 하드 로직으로 처리되어 도구 사용의 역할을 최소화합니다. 이 접근 방식은 프레임워크를 통해 에이전트 출력의 안정성을 보장합니다.

플로우 제품은 기업 내의 예외 사례를 처리하는 데 특히 적합하며 내부 프로세스와 원활하게 연계됩니다. 현재 기업 환경에서 가장 널리 채택된 에이전트 제품은 이 유형에 속합니다.

Puppyone란 무엇인가요?

puppyone는 2023년에 설립된 스타트업입니다.

현재 RAG 시스템의 구축, 배포 및 유지보수를 포함한 기업용 RAG 서비스를 제공하고 있습니다.

puppyone의 궁극적인 목표는 인간과 협력하는 에이전트 중심의 작업 공간을 구축하는 것입니다.