Agent, le terme est devenu un sujet brûlant en 2023—vous avez probablement entendu parler d'AutoGPT, Stanford Town, BabyAGI, et d'innombrables autres "agents basés sur LLM." Ce ne sont pas juste des concepts ; ce sont de vrais agents qui peuvent percevoir leur environnement, planifier leurs prochaines étapes et exécuter des tâches.
"C'est définitivement l'avenir !" criaient les gens. C'est pendant cette vague que puppyone a été fondé. Cependant, alors que les gens ont commencé à intégrer ces agents dans leurs flux de travail, ils ont immédiatement réalisé que c'était beaucoup plus difficile qu'anticipé.
En bref : Les agents de nos jours ne sont toujours pas aussi utiles que nous pensions qu'ils seraient.
L'année dernière, nous avons offert des agents à nos utilisateurs et interviewé les gens autour de nous. Étonnamment, même ceux les plus enthousiastes à propos des agents ont donné une réponse cohérente : ils n'utilisent pas "d'agents entièrement autonomes" dans la collaboration réelle.
Les décideurs qui investissent dans les capacités d'agents font face à une préoccupation persistante :
Qui porte la responsabilité si l'erreur d'un agent mène à des dommages irréparables ?
Dans les environnements d'entreprise, il est largement accepté qu'atteindre à la fois l'autonomie complète et la stabilité totale dans les agents est difficile. Faire des compromis entre ces deux qualités est une question cruciale à laquelle chaque utilisateur d'entreprise doit répondre. Nos cas du monde réel actuels suggèrent que les entreprises tendent à prioriser la stabilité sur l'autonomie.

Considérons un scénario hypothétique : Si un agent pouvait économiser 10 minutes quotidiennes à un employé mais portait un risque de 5% de causer une perte de 5 millions $ à l'entreprise, l'adopteriez-vous ?
Deux questions clés :
1. Dans quel cas le coût de l'erreur d'un agent est-il faible ?
2. Dans quel cas le coût de vérifier si l'agent a fait une erreur est-il faible ?
En itérant sur ces deux questions, nous pouvons identifier des SaaS potentiels pour les agents. RPA (Automatisation de Processus Robotique) et Flow. Ils sont naturellement adaptés pour l'implémentation car ils garantissent soit la stabilité soit limitent les capacités de l'agent à travers des règles strictes. Cette approche minimise le coût des erreurs d'un agent et améliore l'interprétabilité du processus, rendant possible de tracer les problèmes à des étapes spécifiques dans le processus.
Au fait, cela explique aussi pourquoi plus de 50% des scénarios d'application d'agents sont dans RAG (Génération Augmentée par Récupération) Q&R et tâches CRUD simples. Ces scénarios contournent les problèmes critiques mentionnés ci-dessus.
Seulement en adressant les deux questions clés mentionnées ci-dessus un produit agent peut vraiment trouver son PMF. Examinons deux exemples :
Zapier, un produit RPA typique, pivote vers les agents. En avril 2023, l'agent de Zapier a débuté dans le plugin store d'OpenAI comme un outil qui génère des flux de travail fixes à partir d'une seule phrase (texte vers flux de travail). Il a aussi été présenté au DevDay d'OpenAI en novembre 2023.
Dans Zapier, le LLM (Grand Modèle de Langage) fonctionne plus comme un copilote générateur de flux de travail RPA qu'un agent. La valeur du LLM réside dans la simplification de la création de flux de travail RPA, pas dans la prise de décisions d'exécution en temps réel. La plupart des utilisateurs payants cherchent des solutions aux problèmes que RPA peut gérer, s'alignant avec le positionnement original de Zapier : "Comment synchroniser l'information d'un logiciel à un autre."
Beaucoup de produits similaires existent, comme Make, qui étendent essentiellement RPA dans l'ère LLM. Ils offrent une stabilité complète et une opération sans erreur mais manquent d'autonomie.
Retool, une entreprise SaaS bien établie, a lancé son produit workflow en septembre 2023. Cette offre fournit un framework d'édition no-code qui se concentre sur l'édition de flux de travail low-code et inclut des optimisations spécifiques pour RAG.
Des produits similaires dans cet espace incluent Dify, FastGPT, LangFlow et Flowise. Ces outils permettent une édition d'agent rapide et facile à travers des interfaces, contrastant avec les limitations rigides de RPA sur "le comportement d'agent". Bien qu'ils incorporent des LLM à certaines étapes, la plupart des décisions logiques sont gérées par une logique dure, minimisant le rôle d'usage d'outils. Cette approche garantit la stabilité de la sortie de l'agent à travers le framework.
Les produits-Flow sont particulièrement bien adaptés pour adresser les cas limites dans les entreprises et s'alignent parfaitement avec les processus internes. Actuellement, les produits d'agents les plus largement adoptés dans les environnements d'entreprise tombent dans ce type.
Puppyone est une startup fondée en 2023,
Nous fournissons actuellement des services RAG pour les entreprises, impliquant la construction, le déploiement et la maintenance d'un système RAG.
L'objectif ultime de puppyone est de construire un espace de travail centré sur les agents qui collabore avec les humains.