Après la révolution ChatGPT en 2022, la révolution ChatGPT Agent en 2025
Désormais, ChatGPT réfléchit et agit. À l’aide de son propre ordinateur, il choisit les bonnes compétences agentiques pour réaliser la tâche demandée. C’est ChatGPT Agent
ChatGPT peut désormais travailler pour vous à l’aide de son propre ordinateur et gérer des tâches complexes du début à la fin. Lui demander, par exemple, de gérer des requêtes telles que « regarde dans mon calendrier et fais-moi un point sur les clients de mes prochains rendez-vous en fonction des dernières actualités » ou « analyse trois concurrents et crée un diaporama ».
L’éventail de tâches est infini : faire du shopping, remplir des formulaires compliqués, faire des réservations, vérifier son calendrier et trouver des disponibilités pour des restaurants, organiser un emploi du temps, compléter un document avec des données issues du web, etc. Il est évidemment possible de demander à ChatGPT Agent de faire plusieurs choses en même temps : il agit alors en tant que super Deep Research.
Utile pour les tâches chronophages
Sur le papier, l’agent sait faire. Il peut enchaîner plusieurs étapes : recherche, interaction visuelle, confirmation. Des tâches souvent chronophages peuvent ainsi être partiellement déléguées. Mais cela reste sous supervision : l’utilisateur garde la main sur les actions sensibles comme les paiements, pour éviter les pièges tendus par les pirates informatiques.
OpenAI a entraîné ChatGPT Agent via l’apprentissage par renforcement, afin qu’il apprenne à choisir intelligemment les bons outils en fonction du contexte. L’idée ? Éviter qu’il n’utilise tous les outils pour une tâche simple, et qu’il adopte des réflexes d’efficacité.
Les résultats semblent être au rendez-vous, du moins, sur les benchmarks dans un premier temps : + 27 % de performance sur le raisonnement mathématique avancé ; + 42 % d’efficacité sur des tâches avec accès aux outils. Notons aussi d’excellents résultats sur les benchmarks du type Web Arena et Spreadsheet Bench.
L’agent reste toutefois fragile dans des environnements très dynamiques ou mal structurés. Il peut aussi tomber dans des pièges de sécurité comme les prompt injections sur des sites malveillants, même si OpenAI a mis en place des moniteurs de sécurité et des mécanismes de contrôle utilisateur.
Pour des flux de travail itératifs et collaboratifs
Toutes ces opérations sont réalisées à l’aide de son propre ordinateur virtuel, qui préserve le contexte nécessaire à la tâche, même lorsqu’elle implique l’utilisation de plusieurs outils. Le modèle est par exemple capable d’ouvrir une page à l’aide du navigateur texte ou visuel, de télécharger un fichier sur le Web, de le manipuler en exécutant une commande dans le terminal, puis d’afficher le résultat dans le navigateur visuel. Il adapte son approche pour mener à bien les tâches de manière rapide, précise et efficace.
L’agent ChatGPT est conçu pour des flux de travail itératifs et collaboratifs, bien plus interactifs et flexibles que les modèles précédents. Il est possible d’interrompre le travail de ChatGPT à tout moment pour clarifier les instructions, l’orienter vers les résultats souhaités ou changer intégralement la tâche demandée. Il reprendra là où il s’était arrêté, avec les nouvelles informations, sans toutefois perdre les progrès réalisés précédemment. De même, ChatGPT Agent peut demander de manière proactive des informations supplémentaires lorsque cela est nécessaire afin de s’assurer que la tâche reste en adéquation avec les objectifs.