Jean Desauw
Retour au Blog
Agentic Coding
Claude Code
Autonomy Dial
Anthropic

Code with Claude London : le curseur d'autonomie est devenu la valeur par défaut

JD
Jean Desauw
6 min de lecture
Code with Claude London : le curseur d'autonomie est devenu la valeur par défaut

Boris Cherny, qui dirige Claude Code chez Anthropic, a dit quelque chose sur la scène de Londres lundi que j'attends depuis six mois de la part d'un vendor.

« La valeur par défaut n'est plus "je vais prompt Claude Code". La valeur par défaut, c'est désormais "je vais laisser Claude prompt Claude Code". »

Ça, c'est le curseur d'autonomie, énoncé comme position par défaut d'Anthropic. Le curseur d'autonomie, c'est le framework que j'utilise pour réfléchir à la dose d'agence que tu délègues à un agent IA. Bas du curseur : tu écris une spec serrée, l'agent exécute une étape, tu vérifies, tu continues. Haut du curseur : tu fixes l'objectif, l'agent boucle dessus sans toi. Boris vient de déclarer que le haut du curseur est la valeur par défaut.

C'est une lecture practitioner de la keynote d'ouverture de Code with Claude London du 19 mai. Ce que les annonces signifient vraiment si tu ships du code avec un agent aujourd'hui, ce qu'Anthropic a su faire, et où ça reste de l'aspiration.

L'an dernier, je lisais chaque edit. Aujourd'hui, je lis des PR.

Cat Wu, qui lead le produit Claude Code, a dressé le même constat que Boris. Il y a un an : « Je lisais chaque edit qu'il essayait de faire, chaque permission prompt. » Aujourd'hui : « La plupart d'entre nous tournent en auto mode pour déléguer les permissions à Claude, et on revient checker une fois que Claude a déjà testé, vérifié ses changements, et a une PR prête pour nous. »

J'ai fait ce même shift aux alentours de février. Le déclencheur n'a pas été un meilleur modèle. C'est un meilleur setup. Mon CLAUDE.md est devenu assez serré pour que l'agent arrête de faire n'importe quoi. Mes hooks de vérification sont devenus assez bruyants pour que je fasse confiance aux propres checks de l'agent. Après ça, rester planté devant chaque permission prompt ressemblait à du co-pilotage de voiture autonome. Plus d'anxiété, zéro sécurité en plus.

Si tu lis encore chaque edit, le modèle n'est pas ton bottleneck. C'est ton scaffolding.

Ce qu'Anthropic a réellement livré sur le curseur d'autonomie

Trois choses dans la keynote qui changent la façon dont la boucle tourne.

Routines. Claude Code peut maintenant tourner sur un schedule, en réponse à un webhook, ou depuis un appel API. Boris a présenté les routines comme des prompts d'ordre supérieur. « Je ne suis plus celui qui prompt. Je suis celui qui crée une routine qui prompt. » Si tu as déjà écrit un cron job qui trigger ton agent sur chaque nouvelle issue GitHub, tu connais déjà ce pattern. Anthropic vient d'en faire une primitive first-class.

Outcomes. Tu déclares à quoi ressemble le succès, l'agent itère dessus. C'est le même pattern de boucle que je recommande en boucle. Définis un verifier, laisse l'agent re-tourner jusqu'à ce que le verifier dise oui. La différence, c'est qu'Outcomes vit dans Claude Managed Agents, donc l'itération se passe server-side au lieu d'avoir lieu dans ta session terminal.

Dreaming. Claude introspecte ses propres transcripts précédents et s'améliore tout seul. Anthropic a livré ça comme partie de Managed Agents. C'est ce qu'un vendor a fait de plus proche des patterns de mémoire persistante dont j'écris depuis un moment avec le protocole Egg et le modèle tulpa. La forme est juste. La profondeur, on verra.

Deux autres primitives côté développeur méritent qu'on s'y arrête. CI autofix babysitte ta PR jusqu'au vert : il récupère les commentaires de review, fixe les lint nits, retry les tests flaky, rebas[e] à travers les conflits de merge. Les sandboxes self-hosted laissent Claude Managed Agents exécuter du travail sur ton infra, avec un support first-class pour Vercel, Modal, Cloudflare et Daytona. Autofix en particulier ferme la boucle la plus chiante de l'async coding : l'agent ship une PR, le CI fail sur un flake, la PR reste rouge pendant une heure parce que tu n'es pas devant ton laptop.

Je vais plus loin sur le curseur d'autonomie dans le Chapitre 3 du cours d'agentic coding, "The Human in the Loop". Le curseur, c'est le concept unique qui décide si ton agent te fait gagner du temps ou t'en fait perdre.

Où la keynote restait de l'aspiration

L'autre couche de la keynote, c'était la direction, pas la livraison. Trois éléments ressortent.

Des context windows qui paraissent effectivement infinies. Lisa Crofoot, de l'équipe research PM, a utilisé cette phrase exacte. Pas « sont infinies ». « Paraissent » infinies. La context window d'1M tokens que j'utilise déjà quotidiennement sur Claude Code, elle est réelle. « Effectivement infinies » implique des agents long-running qui tiennent l'état sur des heures de travail continu sans perdre le fil. C'est le pari. Ce n'est pas la réalité actuelle.

Mythos preview. Le prochain modèle. La démo où Mythos a lu l'arbre source complet d'OpenBSD et a remonté une vulnérabilité vieille de 27 ans qui avait survécu à chaque reviewer humain, chaque fuzzer, chaque static analyzer qu'on lui a jeté à la figure pendant trois décennies. C'est un résultat frappant. C'est aussi une « preview ». Lisa et Boris sont restés prudents. Opus 4.7, c'est le modèle sur lequel tu ships aujourd'hui. Mythos justifie le framing de la keynote, « l'exponentielle continue d'avancer ». Build pour Opus, surveille Mythos.

90 % de coding autonome. Oscar Mowen, qui lead la technologie chez Mercado Libre, a annoncé un target Q3 de 90 % de coding autonome dans une PR loop fully agent-driven. 23 000 ingénieurs, 500 000 PRs reviewées, 9 000 apps modernisées. C'est le réglage de curseur d'autonomie le plus ambitieux que j'aie entendu un org d'ingénierie réel s'engager publiquement. C'est aussi un target, pas un résultat. À surveiller, pas à copier encore.

Le shift concret pour cette semaine

Si tu ne retiens qu'une chose de la keynote et que tu la ships cette semaine, choisis une tâche que tu lances actuellement à la main et transforme-la en routine.

Des exemples concrets de mon propre setup, depuis que la keynote est tombée.

La tâche « trier les nouvelles issues GitHub » qui était avant un gh issue list manuel suivi d'une session Claude Code. Maintenant une routine. Fire toutes les deux heures, ouvre des PRs labellisées pour les issues qu'elle peut résoudre proprement.

La tâche « faire tourner le prompt de cover du blog » qui me coupait mon matin. Maintenant une routine rattachée à un webhook de PR.

Le CI failure sur un test flaky. Maintenant le problème de CI autofix, pas le mien.

Le point, ce ne sont pas les automatisations. Le point, c'est la posture. Tant que c'est toi qui lances le prompt, tu restes le bottleneck que le curseur d'autonomie essaie de retirer.

La phrase de Boris, c'est la version la plus nette de cette thèse que j'aie entendue d'un vendor. La keynote ne nous a pas donné un nouveau modèle. Elle nous a donné la permission d'arrêter de traiter le prompting comme le travail.

Le curseur d'autonomie, le pattern des routines, les boucles de vérification qui rendent tout ça safe. Démarre le cours d'agentic coding pour la méthode complète.

Premier chapitre gratuit

Apprenez le workflow agentic coding que j'utilise en production

Comment je structure mes repos, gère le contexte, et fais tourner des agents en production. Écrit pour que vous puissiez faire pareil.