自律エージェントの実用化はなぜこれほど難しいのか?

2024年9月10日Guantum @puppyone founder

エージェント、この言葉は2023年に注目の的となりました。AutoGPT、スタンフォードタウン、BabyAGIなど、数え切れないほどの「LLMベースのエージェント」を耳にしたことがあるでしょう。これらは単なるコンセプトではなく、環境を感知し、次のステップを計画し、タスクを実行できる本物のエージェントです。

「これこそが未来だ!」と人々は叫んでいました。puppyoneが設立されたのも、まさにこの波の中でした。しかし、人々がこれらのエージェントを自身のワークフローに統合し始めると、予想以上に困難であることがすぐに明らかになりました。

要するに、今日のエージェントは、私たちが期待したほどにはまだ役に立っていないのです。

自律エージェントの実用化はなぜこれほど難しいのか?

昨年、私たちはユーザーにエージェントを提供し、周囲の人々にインタビューしました。驚くべきことに、エージェントに最も熱心な人々でさえ、「完全に自律的なエージェント」を実際の協업で使用していないという一貫した回答をしました。

エージェントの能力を導入する意思決定者は、常に次のような懸念を抱えています。

エージェントのミスが修復不可能な損害につながった場合、誰が責任を負うのか?

企業環境では、エージェントの完全な自律性と完全な安定性の両方を達成することは困難であると広く受け入れられています。この2つの質の間のトレードオフは、すべての企業ユーザーが答えなければならない重要な問題です。現在の実世界のケースでは、企業は自律性よりも安定性を優先する傾向があることを示唆しています。

automous vs stable, AutoGPT, AutoGen, LangFlow, Flow, RPA

仮説のシナリオを考えてみましょう。もしエージェントが従業員の時間を毎日10分節約できる一方で、会社に500万ドルの損失をもたらす5%のリスクがあるとしたら、あなたはそのエージェントを導入しますか?

2つの重要な問い:

1. どのような場合に、エージェントのミスのコストは低いか?

2. どのような場合に、エージェントがミスを犯したかどうかを検証するコストは低いか?

これら2つの問いを繰り返すことで、エージェント向けのSaaSの可能性を見出すことができます。RPA(ロボティック・プロセス・オートメーション)とFlowです。これらは、安定性を保証するか、厳格なルールによってエージェントの能力を制限するため、実装に自然に適しています。このアプローチは、エージェントのミスのコストを最小限に抑え、プロセスの解釈可能性を向上させ、問題をプロセスの特定のステップに追跡することを可能にします。

ちなみに、これはエージェントの応用シナリオの50%以上がRAG(検索拡張生成)Q&Aと単純なCRUDタスクである理由も説明しています。これらのシナリオは、前述の重要な問題を回避しています。

エージェントの能力はどのように活用できるか?

上記の2つの重要な問いに取り組むことによってのみ、エージェント製品は真のPMF(プロダクトマーケットフィット)を見出すことができます。2つの例を見てみましょう。

Zapier (RPA製品)

典型的なRPA製品であるZapierは、エージェントへの転換を図っています。2023年4月、ZapierのエージェントはOpenAIのプラグインストアに、一文から固定のワークフローを生成するツール(テキストからワークフローへ)としてデビューしました。また、2023年11月のOpenAIのDevDayでも紹介されました。

Zapierでは、LLM(大規模言語モデル)はエージェントというよりも、RPAワークフロー生成のコパイロットとして機能します。LLMの価値は、リアルタイムの実行決定を行うことではなく、RPAワークフローの作成を簡素化することにあります。有料ユーザーの多くは、RPAが処理できる問題の解決策を求めており、これはZapierの当初のポジショニングである「あるソフトウェアから別のソフトウェアへ情報を同期する方法」と一致しています。

Makeなど、同様の製品は数多く存在し、本質的にはRPAをLLM時代に拡張したものです。これらは完全な安定性とエラーのない操作を提供しますが、自律性に欠けます。

Retool Workflow (Flow製品)

確立されたSaaS企業であるRetoolは、2023年9月にワークフロー製品を発売しました。この製品は、ローコードのワークフロー編集に焦点を当てたノーコード編集フレームワークを提供し、RAGに特化した最適化も含まれています。

この分野の同様の製品には、Dify、FastGPT、LangFlow、Flowiseなどがあります。これらのツールは、インターフェースを介して迅速かつ簡単なエージェント編集を可能にし、RPAの「エージェントの振る舞い」に対する厳格な制限とは対照的です。特定の段階でLLMを組み込んでいますが、ほとんどの論理的な決定はハードロジックによって処理され、ツール使用の役割は最小限に抑えられています。このアプローチは、フレームワークを通じてエージェントの出力の安定性を保証します。

Flow製品は、企業内のコーナーケースに対処するのに特に適しており、内部プロセスとシームレスに連携します。現在、企業環境で最も広く採用されているエージェント製品は、このタイプに分類されます。

Puppyoneとは?

puppyoneは2023年に設立されたスタートアップです。

現在、企業向けにRAGシステムの構築、展開、保守を含むRAGサービスを提供しています。

puppyoneの最終的な目標は、人間と協働するエージェント中心のワークスペースを構築することです。