AI 에이전트 제품에서의 OpenAI의 움직임

2024년 10월 3일Guantum @puppyone founder

대규모 언어 모델의 선두주자인 OpenAI는 에이전트 기반 제품 구현에도 앞장서 왔습니다. 지난 한 해 동안 OpenAI는 여러 에이전트 제품을 공개했습니다. 이 글에서는 OpenAI의 에이전트 제품 발전 과정과 그 영향력을 살펴보겠습니다.

플러그인 스토어

에이전트의 가장 초기 상업적 적용은 2023년 4월에 출시된 OpenAI의 플러그인 스토어에서 시작되었습니다. 사용자는 에이전트가 액세스할 수 있는 플러그인을 최대 3개까지 지정하고 사용자와의 채팅을 지원할 수 있었습니다.

2023년 4월 초에 처음 출시되었을 때 차세대 앱 스토어로 간주되었습니다. 그러나 이후 사용자 수가 기대에 미치지 못했습니다. 결국 2023년 11월에 폐쇄되고 GPTs와 올툴즈로 대체되었습니다.

GPTs

GPTs는 2023년 11월 Dev Day에서 에이전트 스토어로 출시되었습니다. 자연어 대화를 통해 자신만의 에이전트를 신속하게 개발하고 배포하는 기능에 중점을 두었으며, ToC 시나리오를 대상으로 했습니다. 처음에는 높은 기대를 받았습니다.

그러나 나중에 GPTs가 심층 개발의 요구를 충족시킬 수 없고 복잡한 시나리오를 처리할 수 없는 반면, 간단한 시나리오는 올툴즈 에이전트를 사용하여 완전히 해결할 수 있다는 것이 입증되었습니다.

결국 GPTs는 번성하는 생태계의 초석이라기보다는 스타트업이 사용자를 제품으로 유인하는 도구에 더 가까워졌습니다.

올툴즈 에이전트

올툴즈 에이전트는 2023년 11월 Dev Day에서 출시되었습니다. 웹 검색, 코드 해석, DALLE-3 세 가지 도구를 통합했습니다. 또한 웹 브라우징과 로컬 RAG도 암묵적으로 포함되었습니다.

이러한 도구 통합은 도구 구성 및 선택 비용을 모델에 전가함으로써 사용자가 수동으로 자신의 도구를 설정할 필요를 없애 객관적으로 사용자의 노력을 줄여줍니다.

그러나 OpenAI는 2024년 중반에 일부 사용자를 대상으로 올툴즈 에이전트에서 웹 검색 도구를 비밀리에 제거했습니다. 이 AB 테스트는 너무 미묘해서 많은 사람들이 눈치 채지 못했습니다.

이러한 변경은 의도하지 않은 시나리오에서 검색을 사용하면 응답의 질이 낮아질 수 있기 때문일 수 있습니다. 또한 질문에 답하기 위해 검색을 사용할지 여부에 대한 사용자의 의도를 인식하는 것이 어려운 것으로 입증되었습니다. 따라서 이 문제에 대한 OpenAI의 제품 접근 방식은 여전히 모호합니다.

이는 AI 검색 엔진과 챗봇이라는 두 종류의 제품 간에 차별화가 있음을 시사할 수 있습니다.

코드 인터프리터 (데이터 분석)

코드 인터프리터는 2023년 7월 초에 출시되었으며, ChatGPT가 코드를 완료한 후 자동으로 실행하는 기능을 갖추고 있습니다. 코드 실행 결과 오류가 발생하면 오류를 기반으로 자동으로 새 코드를 생성하고 다시 실행을 시도합니다. 3회 이상 연속 오류가 발생하면 '작업을 완료할 수 없음'이라는 응답이 제공됩니다. 코드 인터프리터는 어느 정도 자동으로 디버깅할 수 있어 매우 실용적입니다.

이후 코드 인터프리터는 데이터 분석으로 이름이 변경되었습니다. 데이터 분석 시나리오를 중심으로 많은 사용자 경험 향상이 이루어졌습니다. 예를 들어, 데이터 처리 중에 생성된 이미지를 확대하고 중앙에 배치할 수 있으며, 채팅 표시줄이 사이드바로 이동하여 사용자가 그림과 채팅할 수 있게 되었습니다.

OpenAI-o1

OpenAI-o1은 제품이 아니라 모델입니다. 이 모델은 2024년 9월에 출시되었으며, 추론 비용을 높이고 사고의 사슬(CoT)을 사용하여 복잡한 문제를 해결하는 것을 목표로 합니다. 답변을 제공하기 전에 생각을 해야 하므로, 이전 생각을 바탕으로 다음에 무엇을 생각할지 결정하는 에이전트의 한 형태로 간주될 수 있습니다. 이러한 단계별 사고는 모델이 더 어려운 문제를 해결하는 데 도움이 됩니다. 이 체계적인 접근 방식을 통해 모델은 이전에 해결하기 어려웠던 복잡한 문제를 해결할 수 있습니다.

요약

OpenAI는 많은 에이전트 시나리오를 시도했습니다. 플러그인 스토어와 GPTs는 엇갈린 결과를 낳았으며, 성공이라고 보기는 어렵습니다. 반면 코드 인터프리터와 올툴즈 에이전트는 상당한 실용성을 보여주었습니다.

플러그인 스토어 VS 올툴즈 에이전트

작업을 위해 도구에 의존하는 에이전트는 이러한 도구에 대한 충분한 모델 수준의 데이터를 가지고 있어야 합니다. 플러그인 스토어에서처럼 단순히 프롬프트를 사용하여 도구를 호출하는 것은 현재 모델의 기능으로는 효과적이지 않습니다.

올툴즈 에이전트(웹 검색 포함) VS 올툴즈 에이전트(웹 검색 미포함)

OpenAI와 같은 선구자조차도 일반적인 시나리오에서 지원을 위해 검색 엔진을 언제 사용해야 할지 결정하는 데 어려움을 겪습니다. 현재 OpenAI는 이 문제를 부분적으로 사용자에게 넘겼으며(ChatGPT를 사용할지 SearchGPT를 사용할지 결정), 이는 일부 AI 검색 스타트업에게 기회가 될 수도 있습니다.

코드 인터프리터 VS GPTs

실용적인 에이전트는 프롬프트 수준의 프로그래밍 이상을 요구합니다. 수많은 의사 결정 메커니즘이 필요하며, 이는 종종 자연어 프롬프트가 아닌 코드로 달성됩니다. 아이러니하게도 OpenAI 자체의 어시스턴트 플랫폼은 코드 인터프리터만큼 발전된 에이전트를 만들 수 없습니다.

SELF Evolving AI Agents