Karpathy's Autoresearch & PROGRAM.md: AI Die Experimenten Uitvoert Terwijl Je Slaapt
Op 7 maart 2026 publiceerde Andrej Karpathy --- voormalig Tesla AI-directeur en OpenAI-medeoprichter --- een repo die de AI-wereld in beweging bracht: autoresearch.
Het idee is misleidend eenvoudig: geef een AI-agent een kleine maar echte LLM-trainingsopstelling en laat hem ‘s nachts autonome experimenten uitvoeren. Het past de code aan, traint 5 minuten, controleert of het resultaat verbeterde, behoudt of verwijdert de wijziging, en herhaalt.
100 experimenten terwijl je slaapt. Nul menselijke interventie.
Maar hier is het deel dat belangrijk is voor de toekomst van programmeren: de mens schrijft geen Python. De mens schrijft een Markdown-bestand.
Wat Is program.md?
In het hart van autoresearch bevindt zich een bestand genaamd program.md. Het is een Markdown-document dat dient als instructiehandleiding voor de AI-agent.
In plaats van handmatig hyperparameters te tunen, leersnelheden aan te passen of neurale netwerkarchitecturen in Python te wijzigen, schrijft de onderzoeker natuurlijketaalinstructies in program.md. De AI-agent leest deze instructies en past de trainingscode (train.py) op basis daarvan autonoom aan.
Zoals Karpathy het verwoordde: je raakt geen van de Python-bestanden aan zoals je normaal als onderzoeker zou doen. In plaats daarvan programmeer je de program.md Markdown-bestanden die context bieden aan de AI-agenten.
Hoe Autoresearch Werkt
Het systeem is elegant in zijn eenvoud:
- De mens bewerkt
program.md--- stelt onderzoeksdoelen, beperkingen en strategie in - De AI-agent (Claude, Codex of een andere LLM) leest
program.mden pasttrain.pyaan - Training draait precies 5 minuten, waarbij validatieverlies (val_bpb) wordt gemeten
- Als verbeterd, wordt de wijziging bewaard als een git commit op een feature branch
- Als niet verbeterd, reset git terug naar het beginpunt
- Herhaal oneindig
De gehele trainingscodebase is ~630 regels Python --- klein genoeg om volledig in het contextvenster van een LLM te passen. Dit is bewust ontworpen. De agent moet het hele systeem begrijpen om intelligente modificaties te maken.
De Resultaten
Karpathy liet autoresearch ongeveer twee dagen draaien op een depth-12-model. De AI-agent ontdekte autonoom circa 20 verbeteringen die de Time to GPT-2-benchmark reduceerden van 2,02 uur naar 1,80 uur --- een verbetering van 11% zonder menselijke interventie.
Elk punt in de visualisatie vertegenwoordigt een complete LLM-trainingsrun. De agent werkt in een autonome lus en accumuleert git commits naarmate het betere instellingen vindt voor de neurale netwerkarchitectuur, optimizer en hyperparameters.
Waarom program.md Verder Gaat dan ML-onderzoek
Autoresearch gaat over ML-training, maar het patroon dat het introduceert is universeel: AI-agenten programmeren met Markdown-bestanden.
Dit is geen geïsoleerd idee. Kijk naar wat er plaatsvindt in het AI-ecosysteem:
| Bestand | Doel |
|---|---|
program.md | Programmeert autonome onderzoeksagenten (Karpathy) |
AGENTS.md | Programmeert AI-codeeragenten (60K+ repos, Linux Foundation) |
CLAUDE.md | Programmeert Claude Code-gedrag |
.cursorrules | Programmeert Cursor AI-gedrag |
llms.txt | Programmeert hoe AI-crawlers websites begrijpen |
Het patroon is elke keer identiek: een mens schrijft een Markdown-bestand, en een AI-agent gebruikt het als instructies om autonoom te opereren.
Markdown is de programmeertaal voor AI-agenten geworden.
Van Vibe Coding naar Agentische Engineering
Karpathy zelf bedacht “vibe coding” in 2025 --- het idee van code schrijven door intent te beschrijven in plaats van syntaxis. Maar in vroeg 2026 zei hij dat vibe coding al voorbijgestreefd is.
De nieuwe term? Agentische engineering: je schrijft 99% van de tijd geen code rechtstreeks. Je orkestreeert agenten die dat doen, en fungeert als toezicht.
Autoresearch is de puurste uitdrukking van dit idee. De taak van de onderzoeker verschuift van “hoeveel experimenten heb je vandaag uitgevoerd?” naar “hoe goed waren de experimentrichtingen die je instelde?” Het Markdown-bestand is hoe je die richtingen instelt.
Wat Dit Betekent voor Kenniswerkers
Je hoeft geen LLMs te trainen om van autoresearch te leren. Het patroon is overal van toepassing:
- Ontwikkelaars schrijven AGENTS.md om AI-codeerassistenten te sturen
- Onderzoekers schrijven program.md om autonome experimenten te sturen
- Contentmakers schrijven prompts om AI-schrijfassistenten te sturen
- Analisten schrijven instructies om AI-dataverwerkingspipelines te sturen
In elk geval wordt de taak van de mens: schrijf de best mogelijke Markdown-instructies. De AI verwerkt de uitvoering.
Je Markdown-first Workflow Bouwen
Als Markdown de universele interface voor AI-agenten wordt, is het hebben van schone Markdown-versies van je referentiemateriaal essentieel.
Als je een program.md voor autoresearch of een AGENTS.md voor je codebase schrijft, put je uit documentatie, papers, blogposts en voorbeelden die je op het web hebt gezien. Save stelt je in staat dit alles met één klik als schone Markdown te vastleggen --- klaar om te refereren, te citeren of in je agentinstructies te verwerken.
De workflow: vind iets nuttigs op het web, bewaar het als Markdown met Save, gebruik het om betere agentinstructies te schrijven.
Save converteert elke webpagina naar schone Markdown --- het formaat dat AI-agenten het best begrijpen. Bouw je referentiebibliotheek voor het schrijven van betere AI-instructies. Probeer Save gratis.