自主智能体的“落地”之困:为何如此艰难?

2024年9月10日Guantum @puppyone founder

Agent(智能体),这个词在2023年成为热门话题——你可能听说过AutoGPT、斯坦福小镇、BabyAGI以及无数其他“基于LLM的智能体”。这些不仅仅是概念;它们是能够感知环境、规划下一步并执行任务的真实智能体。

“这绝对是未来!”人们曾如此吶喊。Puppyone正是在这股浪潮中创立的。然而,当人们开始将这些智能体整合到他们的工作流程中时,他们立刻意识到这比预期的要困难得多。

简而言之:如今的智能体仍然没有我们想象中那么有用。

为何让自主智能体变得“有用”如此困难?

去年,我们向用户提供了智能体,并采访了我们周围的人。令人惊讶的是,即使是那些对智能体最热情的人也给出了一个一致的答案:他们并没有在实际协作中使用“完全自主的智能体”。

购买智能体能力的决策者面临一个持续的担忧:

如果智能体的错误导致了无法挽回的损失,谁来承担责任?

在企业环境中,人们普遍认为,要让智能体同时实现完全自主和完全稳定是极具挑战性的。在这两个特性之间进行权衡是每个企业用户都必须回答的关键问题。我们目前的实际案例表明,企业倾向于优先考虑稳定性而非自主性。

自主vs稳定, AutoGPT, AutoGen, LangFlow, Flow, RPA

让我们设想一个假设场景:如果一个智能体每天能为员工节省10分钟,但有5%的风险会给公司造成500万美元的损失,你会购买它吗?

两个关键问题:

1. 在哪种情况下,智能体犯错的成本较低?

2. 在哪种情况下,验证智能体是否犯错的成本较低?

通过反复思考这两个问题,我们可以为智能体找到潜在的SaaS应用场景。RPA(机器人流程自动化)和Flow(工作流)产品天然适合实施,因为它们要么保证稳定性,要么通过严格的规则限制智能体的能力。这种方法最大限度地降低了智能体犯错的成本,并提高了流程的可解释性,使得问题可以追溯到流程中的具体步骤。

顺便说一句,这也解释了为什么超过50%的智能体应用场景集中在RAG(检索增强生成)问答和简单的CRUD(增删改查)任务上。这些场景回避了上述关键问题。

智能体的能力可以如何被利用?

只有通过解决上述两个关键问题,一个智能体产品才能真正找到其产品市场契合点(PMF)。让我们看两个例子:

Zapier (RPA产品)

Zapier是一个典型的RPA产品,目前正朝着智能体的方向转型。2023年4月,Zapier的智能体作为一款能从单句文本生成固定工作流(text-to-workflow)的工具,在OpenAI插件商店首次亮相。它还在2023年11月的OpenAI DevDay上进行了展示。

在Zapier中,大型语言模型(LLM)更多地是作为RPA工作流生成的副驾驶,而不是一个智能体。LLM的价值在于简化RPA工作流的创建过程,而不是在实时执行中做决策。大多数付费用户寻求的是RPA能解决的问题,这与Zapier最初的定位一致:“如何将信息从一个软件同步到另一个软件。”

市面上存在许多类似的产品,例如Make,它们本质上是将RPA扩展到了LLM时代。它们提供完全的稳定性和无错误操作,但缺乏自主性。

Retool Workflow (Flow产品)

Retool是一家成熟的SaaS公司,于2023年9月推出了其工作流产品。该产品提供了一个无代码编辑框架,专注于低代码工作流编辑,并为RAG进行了特定优化。

这个领域的类似产品还包括Dify、FastGPT、LangFlow和Flowise。这些工具通过界面可以快速简便地编辑智能体,与RPA对“智能体行为”的严格限制形成对比。虽然它们在某些阶段整合了LLM,但大多数逻辑决策由硬编码逻辑处理,最大限度地减少了工具使用的角色。这种方法通过框架确保了智能体输出的稳定性。

Flow类型的产品特别适合处理企业内部的边缘案例,并能与内部流程无缝对接。目前,企业环境中应用最广泛的智能体产品就属于这一类型。

什么是Puppyone?

Puppyone是一家成立于2023年的初创公司。

我们目前为企业提供RAG服务,包括RAG系统的构建、部署和维护。

Puppyone的最终目标是构建一个以智能体为中心、与人类协作的工作区。