Op 7 maart 2026 publiceerde Andrej Karpathy --- voormalig Tesla AI-directeur en OpenAI-medeoprichter --- een repo die de AI-wereld in beweging bracht: autoresearch.

Het idee is misleidend eenvoudig: geef een AI-agent een kleine maar echte LLM-trainingsopstelling en laat hem ‘s nachts autonome experimenten uitvoeren. Het past de code aan, traint 5 minuten, controleert of het resultaat verbeterde, behoudt of verwijdert de wijziging, en herhaalt.

100 experimenten terwijl je slaapt. Nul menselijke interventie.

Maar hier is het deel dat belangrijk is voor de toekomst van programmeren: de mens schrijft geen Python. De mens schrijft een Markdown-bestand.

Wat Is program.md?

In het hart van autoresearch bevindt zich een bestand genaamd program.md. Het is een Markdown-document dat dient als instructiehandleiding voor de AI-agent.

In plaats van handmatig hyperparameters te tunen, leersnelheden aan te passen of neurale netwerkarchitecturen in Python te wijzigen, schrijft de onderzoeker natuurlijketaalinstructies in program.md. De AI-agent leest deze instructies en past de trainingscode (train.py) op basis daarvan autonoom aan.

Zoals Karpathy het verwoordde: je raakt geen van de Python-bestanden aan zoals je normaal als onderzoeker zou doen. In plaats daarvan programmeer je de program.md Markdown-bestanden die context bieden aan de AI-agenten.

Hoe Autoresearch Werkt

Het systeem is elegant in zijn eenvoud:

De mens bewerkt program.md --- stelt onderzoeksdoelen, beperkingen en strategie in
De AI-agent (Claude, Codex of een andere LLM) leest program.md en past train.py aan
Training draait precies 5 minuten, waarbij validatieverlies (val_bpb) wordt gemeten
Als verbeterd, wordt de wijziging bewaard als een git commit op een feature branch
Als niet verbeterd, reset git terug naar het beginpunt
Herhaal oneindig

De gehele trainingscodebase is ~630 regels Python --- klein genoeg om volledig in het contextvenster van een LLM te passen. Dit is bewust ontworpen. De agent moet het hele systeem begrijpen om intelligente modificaties te maken.

De Resultaten

Karpathy liet autoresearch ongeveer twee dagen draaien op een depth-12-model. De AI-agent ontdekte autonoom circa 20 verbeteringen die de Time to GPT-2-benchmark reduceerden van 2,02 uur naar 1,80 uur --- een verbetering van 11% zonder menselijke interventie.

Elk punt in de visualisatie vertegenwoordigt een complete LLM-trainingsrun. De agent werkt in een autonome lus en accumuleert git commits naarmate het betere instellingen vindt voor de neurale netwerkarchitectuur, optimizer en hyperparameters.

Waarom program.md Verder Gaat dan ML-onderzoek

Autoresearch gaat over ML-training, maar het patroon dat het introduceert is universeel: AI-agenten programmeren met Markdown-bestanden.

Dit is geen geïsoleerd idee. Kijk naar wat er plaatsvindt in het AI-ecosysteem:

Bestand	Doel
`program.md`	Programmeert autonome onderzoeksagenten (Karpathy)
`AGENTS.md`	Programmeert AI-codeeragenten (60K+ repos, Linux Foundation)
`CLAUDE.md`	Programmeert Claude Code-gedrag
`.cursorrules`	Programmeert Cursor AI-gedrag
`llms.txt`	Programmeert hoe AI-crawlers websites begrijpen

Het patroon is elke keer identiek: een mens schrijft een Markdown-bestand, en een AI-agent gebruikt het als instructies om autonoom te opereren.

Markdown is de programmeertaal voor AI-agenten geworden.

Van Vibe Coding naar Agentische Engineering

Karpathy zelf bedacht “vibe coding” in 2025 --- het idee van code schrijven door intent te beschrijven in plaats van syntaxis. Maar in vroeg 2026 zei hij dat vibe coding al voorbijgestreefd is.

De nieuwe term? Agentische engineering: je schrijft 99% van de tijd geen code rechtstreeks. Je orkestreeert agenten die dat doen, en fungeert als toezicht.

Autoresearch is de puurste uitdrukking van dit idee. De taak van de onderzoeker verschuift van “hoeveel experimenten heb je vandaag uitgevoerd?” naar “hoe goed waren de experimentrichtingen die je instelde?” Het Markdown-bestand is hoe je die richtingen instelt.

Wat Dit Betekent voor Kenniswerkers

Je hoeft geen LLMs te trainen om van autoresearch te leren. Het patroon is overal van toepassing:

Ontwikkelaars schrijven AGENTS.md om AI-codeerassistenten te sturen
Onderzoekers schrijven program.md om autonome experimenten te sturen
Contentmakers schrijven prompts om AI-schrijfassistenten te sturen
Analisten schrijven instructies om AI-dataverwerkingspipelines te sturen

In elk geval wordt de taak van de mens: schrijf de best mogelijke Markdown-instructies. De AI verwerkt de uitvoering.

Je Markdown-first Workflow Bouwen

Als Markdown de universele interface voor AI-agenten wordt, is het hebben van schone Markdown-versies van je referentiemateriaal essentieel.

Als je een program.md voor autoresearch of een AGENTS.md voor je codebase schrijft, put je uit documentatie, papers, blogposts en voorbeelden die je op het web hebt gezien. Save stelt je in staat dit alles met één klik als schone Markdown te vastleggen --- klaar om te refereren, te citeren of in je agentinstructies te verwerken.

De workflow: vind iets nuttigs op het web, bewaar het als Markdown met Save, gebruik het om betere agentinstructies te schrijven.

Save converteert elke webpagina naar schone Markdown --- het formaat dat AI-agenten het best begrijpen. Bouw je referentiebibliotheek voor het schrijven van betere AI-instructies. Probeer Save gratis.