Vers l’auto-amélioration récursive

Quand l’IA se construit d’elle-même. Que reten r de l’expérience d’Anthropic ?

Dans une note de blog, Anthropic introduit le principe d’auto-amélioration récursive, soit la capacité d’une IA à perfectionner ses propres performances, ouvrant potentiellement la voie à une accélération autonome de son développement. Une évolution non risques.

« Nous n’en sommes pas encore là, rassure l’éditeur de Claude. Mais l’auto-amélioration récursive n’est pas inévitable. Elle pourrait arriver plus tôt que la plupart des institutions ne le prévoient… »

Dans sa note de blog du 4 juin, Anthropic s’inquiète d’un développement trop rapide de sa technologie. L’éditeur, souvent critiqué par ses concurrents comme étant un adepte du « marketing de la peur », appelle l’industrie à ralentir. Et, surtout, à réfléchir.

« L’auto-amélioration récursive complète pourrait accroître le risque de perte de contrôle des systèmes d’IA par l’humain. Si ces systèmes sont capables de construire entièrement leurs propres successeurs, les moyens mis en œuvre pour les sécuriser, les surveiller et orienter leur comportement deviendront d’autant plus cruciaux. »

Anthropic évoque le sujet au départ de sa propre expérience. Claude, aujourd’hui, écrit une part importante du code de l’éditeur. En mai 2026, plus de 80 % du code intégré à la base de code était de son fait. « Au deuxième trimestre 2026, l’ingénieur type fusionnait 8 fois plus de code par jour qu’en 2024.4 Cela s’explique par le fait qu’une grande partie du code est écrite par Claude, l’ingénieur se contentant de diriger et de réviser, plutôt que de le taper lui-même. »

Cela dit, le nombre de lignes de code est un indicateur imparfait, car il mesure la quantité plutôt que la qualité.

Quand Claude devient autonome

L’augmentation du nombre de lignes de code écrites correspond aux impressions subjectives de fortes hausses de productivité. Dans un sondage réalisé en mars 2026 auprès de 130 employés des différentes équipes de recherche d’Anthropic, le répondant médian a estimé que sa productivité était environ quatre fois supérieure grâce à Mythos Preview, comparativement à ce qu’elle aurait été sans accès à des modèles d’IA, pour des projets similaires.

« Nous constatons également que les employés d’Anthropic utilisent Claude pour réaliser des tâches qui n’auraient tout simplement pas été possibles autrement, comme le développement d’outils d’exploration et la correction de problèmes longtemps reportés. » Par exemple, en avril 2026, Claude a déployé plus de 800 correctifs, réduisant ainsi d’un facteur mille une catégorie d’erreurs d’API. L’ingénieur responsable de Claude a estimé qu’un humain aurait mis quatre ans pour accomplir ce travail. Résoudre les problèmes des autres est un travail lent et fastidieux, et les humains ont du mal à intégrer autant d’informations nouvelles en même temps.

Preuves issues du monde extérieur

Le rythme d’amélioration des modèles d’IA s’accélère. La durée des tâches qu’ils peuvent accomplir de manière fiable de façon autonome double environ tous les quatre mois, contre un doublement tous les sept mois auparavant.

En mars 2024, Claude Opus 3 pouvait réaliser des tâches logicielles qui prennent environ quatre minutes à un humain, rappelle Anthropic. Un an plus tard, Claude Sonnet 3.7 gérait des tâches d’une heure et demie environ. L’année suivante, Claude Opus 4.6 gérait des tâches de 12 heures. « Si cette tendance se maintient, des tâches qui prennent des jours à une personne qualifiée pourraient devenir accessibles dès cette année. En 2027, les systèmes d’IA pourraient être capables de réaliser des tâches qui prennent des semaines à un humain. »

Pour les tâches les plus ouvertes, le taux de réussite de Claude a atteint 76 % en mai 2026, soit une hausse de 50 points de pourcentage en six mois. À titre d’exemple, une mise à jour de routine a provoqué le plantage de dizaines de milliers de tâches d’entraînement. Un ingénieur a indiqué à Claude l’incident en direct, en lui fournissant seulement quelques informations textuelles et un accès au cluster. « En analysant les tâches en cours et en testant chaque paramètre d’environnement un par un, Claude a isolé le seul paramètre de débogage obscur à l’origine du plantage, l’a reproduit de manière fiable et a validé une solution. En deux heures environ, Claude a accompli ce qui aurait normalement nécessité deux à trois jours de travail. »

Des avancées qui font réfléchir

Le deuxième critère est la capacité d’écrire du code compréhensible et exploitable par un autre ingénieur. L’écart entre les humains et l’IA persiste, mais se réduit rapidement. Bien qu’il n’y ait pas de consensus total au sein de l’équipe d’Anthropic, beaucoup estiment que le code écrit par Claude était encore de qualité inférieure à celui écrit par des humains chez Anthropic fin 2025, et qu’il est aujourd’hui à peu près équivalent. L’éditeur prévoit une amélioration d’ici la fin de l’année.

« Cela a transformé la manière dont nous examinons notre propre code. Les modifications proposées à notre base de code sont désormais analysées par un outil automatisé, Claude, qui recherche les bogues, les failles de sécurité et autres anomalies avant leur intégration. »

Grâce à cet outil, Anthropic a mené une analyse rétrospective et constaté qu’une analyse automatisée par Claude de chaque modification de sa base de code aurait permis de détecter environ un tiers des bogues à l’origine des incidents passés sur claude.ai avant même leur mise en production. « Les ingénieurs qui ont développé ce code comptent parmi les meilleurs au monde dans la conception de ces systèmes. Claude repère désormais les erreurs qui leur ont échappé. »

Et maintenant ?

Cette accélération n’est pas sans danger. Une IA qui se « fabrique par elle-même » est donc fort proche. Avec des conséquences insoupçonnées, reconnait Anthropic.

« Nous pensons qu’il serait bon pour le monde d’avoir la possibilité de ralentir ou de suspendre temporairement le développement de l’IA de pointe, afin de permettre aux structures sociétales et à la recherche sur l’alignement de suivre le rythme des progrès de la technologie », plaide l’entreprise.

Le créateur des modèles Claude cite le précédent du traité sur les forces nucléaires à portée intermédiaire (FNI) et souligne que ce cadre a mis des décennies à s’établir, mais que le temps est plus pressant pour l’IA, jugée « bien plus facile à dissimuler que des silos de missiles ».