L'Autoresearch de Karpathy & PROGRAM.md : l'IA qui fait des expériences pendant que vous dormez
Le 7 mars 2026, Andrej Karpathy — ancien directeur IA de Tesla et cofondateur d’OpenAI — a publié un dépôt qui a enflammé le monde de l’IA : autoresearch.
L’idée est trompeusement simple : donner à un agent IA un petit mais vrai setup d’entraînement de LLM et le laisser faire des expériences de façon autonome toute la nuit. Il modifie le code, entraîne pendant 5 minutes, vérifie si le résultat s’est amélioré, garde ou jette le changement, et recommence.
100 expériences pendant que vous dormez. Zéro intervention humaine.
Mais voici la partie importante pour l’avenir de la programmation : l’humain n’écrit pas de Python. L’humain écrit un fichier Markdown.
Qu’est-ce que program.md ?
Au cœur d’autoresearch se trouve un fichier appelé program.md. C’est un document Markdown qui sert de manuel d’instructions pour l’agent IA.
Au lieu d’ajuster manuellement les hyperparamètres, de modifier les taux d’apprentissage, ou de modifier des architectures de réseaux de neurones en Python, le chercheur rédige des instructions en langage naturel dans program.md. L’agent IA lit ces instructions et modifie de façon autonome le code d’entraînement (train.py) en conséquence.
Comme Karpathy l’a dit : vous ne touchez aucun des fichiers Python comme vous le feriez normalement en tant que chercheur. À la place, vous programmez les fichiers Markdown program.md qui fournissent du contexte aux agents IA.
Comment fonctionne Autoresearch
Le système est élégant dans sa simplicité :
- L’humain édite
program.md— définissant les objectifs de recherche, les contraintes et la stratégie - L’agent IA (Claude, Codex, ou un autre LLM) lit
program.mdet modifietrain.py - L’entraînement tourne exactement 5 minutes, mesurant la perte de validation (val_bpb)
- Si amélioré, le changement est conservé comme commit git sur une branche de fonctionnalité
- Si pas amélioré, git remet à l’état précédent
- Répète indéfiniment
La base de code d’entraînement entière fait ~630 lignes de Python — assez petite pour tenir entièrement dans la fenêtre de contexte d’un LLM. C’est intentionnel. L’agent doit comprendre tout le système pour faire des modifications intelligentes.
Les résultats
Karpathy a laissé autoresearch tourner pendant environ deux jours sur un modèle de profondeur 12. L’agent IA a découvert de façon autonome environ 20 améliorations qui ont réduit le benchmark Time to GPT-2 de 2,02 heures à 1,80 heures — une amélioration de 11 % sans intervention humaine.
Chaque point dans la visualisation représente un entraînement complet de LLM. L’agent travaille en boucle autonome, accumulant des commits git à mesure qu’il trouve de meilleures configurations pour l’architecture du réseau de neurones, l’optimiseur et les hyperparamètres.
Pourquoi program.md compte au-delà de la recherche en ML
Autoresearch concerne l’entraînement de ML, mais le pattern qu’il introduit est universel : programmer des agents IA avec des fichiers Markdown.
Ce n’est pas une idée isolée. Regardez ce qui se passe dans l’écosystème IA :
| Fichier | Objectif |
|---|---|
program.md | Programme des agents de recherche autonomes (Karpathy) |
AGENTS.md | Programme des agents de codage IA (60K+ dépôts, Linux Foundation) |
CLAUDE.md | Programme le comportement de Claude Code |
.cursorrules | Programme le comportement de Cursor AI |
llms.txt | Programme comment les crawlers IA comprennent les sites web |
Le pattern est identique à chaque fois : un humain écrit un fichier Markdown, et un agent IA l’utilise comme instructions pour opérer de façon autonome.
Markdown est devenu le langage de programmation des agents IA.
Du Vibe Coding à l’Agentic Engineering
Karpathy lui-même a inventé le « vibe coding » en 2025 — l’idée d’écrire du code en décrivant l’intention plutôt que la syntaxe. Mais début 2026, il a dit que le vibe coding est déjà passé.
Le nouveau terme ? Agentic Engineering : vous n’écrivez pas directement de code 99 % du temps. Vous orchestrez des agents qui le font, et agissez en tant que superviseur.
Autoresearch est l’expression la plus pure de cette idée. Le travail du chercheur passe de « combien d’expériences avez-vous faites aujourd’hui ? » à « à quel point les directions d’expériences que vous avez fixées étaient-elles bonnes ? » Le fichier Markdown est la façon dont vous fixez ces directions.
Ce que cela signifie pour les travailleurs du savoir
Vous n’avez pas besoin d’entraîner des LLMs pour apprendre de l’autoresearch. Le pattern s’applique partout :
- Les développeurs écrivent AGENTS.md pour diriger les assistants de codage IA
- Les chercheurs écrivent program.md pour diriger des expériences autonomes
- Les créateurs de contenu écrivent des prompts pour diriger les assistants d’écriture IA
- Les analystes écrivent des instructions pour diriger les pipelines de traitement de données IA
Dans chaque cas, le travail de l’humain devient : écrire les meilleures instructions Markdown possibles. L’IA gère l’exécution.
Construire votre workflow Markdown-First
Si Markdown devient l’interface universelle pour les agents IA, avoir des versions Markdown propres de votre matériel de référence devient essentiel.
Quand vous rédigez un program.md pour autoresearch ou un AGENTS.md pour votre base de code, vous puisez dans de la documentation, des articles, des billets de blog et des exemples que vous avez vus sur le web. Save vous permet de tout capturer en Markdown propre en un clic — prêt à référencer, extraire ou incorporer dans vos instructions d’agents.
Le workflow : trouver quelque chose d’utile sur le web, le sauvegarder en Markdown, l’utiliser pour rédiger de meilleures instructions d’agents.
Save convertit n’importe quelle page web en Markdown propre — le format que les agents IA comprennent le mieux. Construisez votre bibliothèque de référence pour rédiger de meilleures instructions IA. Essayez Save gratuitement.
## Continue reading
Comment rédiger un bon program.md : guide pratique pour les instructions d'agents IA
program.md est le fichier qui programme les agents IA dans l'autoresearch de Karpathy. Voici comment en écrire un qui obtient des résultats — avec structure, exemples et bonnes pratiques.
Autoresearch pour tous : comment lancer 100 expériences IA pendant votre sommeil
L'autoresearch de Karpathy tourne 100+ expériences ML en une nuit sur un seul GPU. Voici comment ça marche, ce qu'il vous faut, et pourquoi un script Python de 630 lignes est en train de changer la recherche IA.
De README.md à PROGRAM.md : Markdown est désormais un langage de programmation
README.md était pour les humains. AGENTS.md est pour les assistants de code. PROGRAM.md est pour la recherche autonome. Markdown a évolué de la documentation vers le langage de programmation des agents IA.
De SETI@home à AgentHub : la vision de Karpathy pour la recherche IA distribuée
Karpathy dit que la prochaine étape de l'autoresearch est une collaboration distribuée de type SETI@home. AgentHub et Hyperspace le réalisent déjà. Voici ce que ça signifie.
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.