OpenAI在AI智能体产品领域的最新布局

2024年10月3日Guantum @puppyone founder

作为大型语言模型的领跑者,OpenAI也一直在开创基于智能体的产品的实施。在过去的一年中,OpenAI推出了多款智能体产品。本文我将探讨OpenAI智能体产品的发展历程及其影响。

插件商店

最早的智能体商业应用源于OpenAI于2023年4月推出的插件商店。用户最多可以指定三个插件供智能体访问,并协助与用户聊天。

最初于2023年4月初发布时,它被视为下一代应用商店。然而,后续的用户数量未达到预期。最终,它于2023年11月被关闭,并由GPTs和All-tools取而代之。

GPTs

GPTs于2023年11月的开发者日作为智能体商店推出。它专注于通过自然语言对话快速开发和部署自己的智能体的能力,面向ToC场景。最初,它被寄予厚望。

然而,后来证明GPTs无法满足深度开发的需求,也无法处理复杂场景,而简单的场景则可以完全用全能智能体解决。

最终,GPTs更像是初创公司吸引用户使用其产品的工具,而不是一个蓬勃发展的生态系统的基石。

全能智能体

全能智能体于2023年11月的开发者日推出。它集成了三个工具:网页搜索、代码解释器和DALLE-3。此外,它还隐含地包括了网页浏览和本地RAG。

这些工具的集成,通过将配置和选择工具的成本转移到模型上,消除了用户手动设置自己工具的需要,客观上减少了用户的精力。

然而,OpenAI在2024年中期悄悄地为部分用户从全能智能体中移除了网页搜索工具。这次AB测试非常微妙,以至于许多人没有注意到。

这一变化可能是因为在非预期的场景中使用搜索会降低响应质量。此外,识别用户是否打算使用搜索来回答问题的意图也很有挑战性。因此,OpenAI对这个问题的产品方法仍然模糊不清。

这可能表明两种产品之间存在差异化:AI搜索引擎和聊天机器人。

代码解释器(数据分析)

代码解释器于2023年7月初推出,其特点是ChatGPT在完成代码后能自动运行。如果代码出现错误,它会根据错误自动生成新代码并再次尝试运行。如果连续出现三次或更多错误,将给出“无法完成任务”的响应。代码解释器可以在一定程度上自动调试,因此非常实用。

随后,代码解释器更名为数据分析。围绕数据分析场景进行了许多用户体验增强。例如,数据处理过程中生成的图像可以放大并居中显示,聊天栏已移至侧边栏,允许用户与图表进行对话。

OpenAI-o1

OpenAI-o1不是一个产品,而是一个模型。该模型于2024年9月发布,旨在通过增加推理成本和使用思维链(CoT)来解决复杂问题。它在提供答案之前需要思考,因此可以被视为一种智能体,根据其先前的思考来决定下一步要思考什么。这种逐步思考有助于模型解决更困难的问题。这种有条不紊的方法使模型能够解决以前难以解决的复杂问题。

总结

OpenAI尝试了许多智能体场景。插件商店和GPTs的结果好坏参半,不能算完全成功。相比之下,代码解释器和全能智能体显示出了相当大的实用价值。

插件商店 VS 全能智能体

一个依赖工具工作的智能体必须拥有足够的关于这些工具的模型层数据。仅仅像插件商店那样使用提示来调用工具,在当前模型的能力下是无效的。

全能智能体(带网页搜索) VS 全能智能体(不带网页搜索)

即使是像OpenAI这样的先驱,在决定何时使用搜索引擎来支持通用场景时也面临困难。目前,OpenAI只是将这个问题部分地交给了用户(决定使用ChatGPT还是SearchGPT),这也可能意味着一些AI搜索初创公司的机会。

代码解释器 VS GPTs

一个实用的智能体需要的不仅仅是提示级别的编程。它需要许多决策机制,而这些机制通常是通过代码而不是自然语言提示来实现的。具有讽刺意味的是,OpenAI自己的助手平台无法创建一个像代码解释器那样先进的智能体。