L'Autoresearch de Karpathy & PROGRAM.md : l'IA qui fait des expériences pendant que vous dormez

Le 7 mars 2026, Andrej Karpathy — ancien directeur IA de Tesla et cofondateur d’OpenAI — a publié un dépôt qui a enflammé le monde de l’IA : autoresearch.

L’idée est trompeusement simple : donner à un agent IA un petit mais vrai setup d’entraînement de LLM et le laisser faire des expériences de façon autonome toute la nuit. Il modifie le code, entraîne pendant 5 minutes, vérifie si le résultat s’est amélioré, garde ou jette le changement, et recommence.

100 expériences pendant que vous dormez. Zéro intervention humaine.

Mais voici la partie importante pour l’avenir de la programmation : l’humain n’écrit pas de Python. L’humain écrit un fichier Markdown.

Qu’est-ce que program.md ?

Au cœur d’autoresearch se trouve un fichier appelé program.md. C’est un document Markdown qui sert de manuel d’instructions pour l’agent IA.

Au lieu d’ajuster manuellement les hyperparamètres, de modifier les taux d’apprentissage, ou de modifier des architectures de réseaux de neurones en Python, le chercheur rédige des instructions en langage naturel dans program.md. L’agent IA lit ces instructions et modifie de façon autonome le code d’entraînement (train.py) en conséquence.

Comme Karpathy l’a dit : vous ne touchez aucun des fichiers Python comme vous le feriez normalement en tant que chercheur. À la place, vous programmez les fichiers Markdown program.md qui fournissent du contexte aux agents IA.

Comment fonctionne Autoresearch

Le système est élégant dans sa simplicité :

L’humain édite program.md — définissant les objectifs de recherche, les contraintes et la stratégie
L’agent IA (Claude, Codex, ou un autre LLM) lit program.md et modifie train.py
L’entraînement tourne exactement 5 minutes, mesurant la perte de validation (val_bpb)
Si amélioré, le changement est conservé comme commit git sur une branche de fonctionnalité
Si pas amélioré, git remet à l’état précédent
Répète indéfiniment

La base de code d’entraînement entière fait ~630 lignes de Python — assez petite pour tenir entièrement dans la fenêtre de contexte d’un LLM. C’est intentionnel. L’agent doit comprendre tout le système pour faire des modifications intelligentes.

Les résultats

Karpathy a laissé autoresearch tourner pendant environ deux jours sur un modèle de profondeur 12. L’agent IA a découvert de façon autonome environ 20 améliorations qui ont réduit le benchmark Time to GPT-2 de 2,02 heures à 1,80 heures — une amélioration de 11 % sans intervention humaine.

Chaque point dans la visualisation représente un entraînement complet de LLM. L’agent travaille en boucle autonome, accumulant des commits git à mesure qu’il trouve de meilleures configurations pour l’architecture du réseau de neurones, l’optimiseur et les hyperparamètres.

Pourquoi program.md compte au-delà de la recherche en ML

Autoresearch concerne l’entraînement de ML, mais le pattern qu’il introduit est universel : programmer des agents IA avec des fichiers Markdown.

Ce n’est pas une idée isolée. Regardez ce qui se passe dans l’écosystème IA :

Fichier	Objectif
`program.md`	Programme des agents de recherche autonomes (Karpathy)
`AGENTS.md`	Programme des agents de codage IA (60K+ dépôts, Linux Foundation)
`CLAUDE.md`	Programme le comportement de Claude Code
`.cursorrules`	Programme le comportement de Cursor AI
`llms.txt`	Programme comment les crawlers IA comprennent les sites web

Le pattern est identique à chaque fois : un humain écrit un fichier Markdown, et un agent IA l’utilise comme instructions pour opérer de façon autonome.

Markdown est devenu le langage de programmation des agents IA.

Du Vibe Coding à l’Agentic Engineering

Karpathy lui-même a inventé le « vibe coding » en 2025 — l’idée d’écrire du code en décrivant l’intention plutôt que la syntaxe. Mais début 2026, il a dit que le vibe coding est déjà passé.

Le nouveau terme ? Agentic Engineering : vous n’écrivez pas directement de code 99 % du temps. Vous orchestrez des agents qui le font, et agissez en tant que superviseur.

Autoresearch est l’expression la plus pure de cette idée. Le travail du chercheur passe de « combien d’expériences avez-vous faites aujourd’hui ? » à « à quel point les directions d’expériences que vous avez fixées étaient-elles bonnes ? » Le fichier Markdown est la façon dont vous fixez ces directions.

Ce que cela signifie pour les travailleurs du savoir

Vous n’avez pas besoin d’entraîner des LLMs pour apprendre de l’autoresearch. Le pattern s’applique partout :

Les développeurs écrivent AGENTS.md pour diriger les assistants de codage IA
Les chercheurs écrivent program.md pour diriger des expériences autonomes
Les créateurs de contenu écrivent des prompts pour diriger les assistants d’écriture IA
Les analystes écrivent des instructions pour diriger les pipelines de traitement de données IA

Dans chaque cas, le travail de l’humain devient : écrire les meilleures instructions Markdown possibles. L’IA gère l’exécution.

Construire votre workflow Markdown-First

Si Markdown devient l’interface universelle pour les agents IA, avoir des versions Markdown propres de votre matériel de référence devient essentiel.

Quand vous rédigez un program.md pour autoresearch ou un AGENTS.md pour votre base de code, vous puisez dans de la documentation, des articles, des billets de blog et des exemples que vous avez vus sur le web. Save vous permet de tout capturer en Markdown propre en un clic — prêt à référencer, extraire ou incorporer dans vos instructions d’agents.

Le workflow : trouver quelque chose d’utile sur le web, le sauvegarder en Markdown, l’utiliser pour rédiger de meilleures instructions d’agents.

Save convertit n’importe quelle page web en Markdown propre — le format que les agents IA comprennent le mieux. Construisez votre bibliothèque de référence pour rédiger de meilleures instructions IA. Essayez Save gratuitement.

L'Autoresearch de Karpathy & PROGRAM.md : l'IA qui fait des expériences pendant que vous dormez

Qu’est-ce que program.md ?

Comment fonctionne Autoresearch

Les résultats

Pourquoi program.md compte au-delà de la recherche en ML

Du Vibe Coding à l’Agentic Engineering

Ce que cela signifie pour les travailleurs du savoir

Construire votre workflow Markdown-First

## Continue reading

Comment rédiger un bon program.md : guide pratique pour les instructions d'agents IA

Autoresearch pour tous : comment lancer 100 expériences IA pendant votre sommeil

De README.md à PROGRAM.md : Markdown est désormais un langage de programmation

De SETI@home à AgentHub : la vision de Karpathy pour la recherche IA distribuée

Jean-Sébastien Wallez