← Tilbage til blog

Karpathys Autoresearch & PROGRAM.md: AI, der kører eksperimenter mens du sover

· Save Team
markdownaikarpathyautoresearchprogram-mdmachine-learningagents

Den 7. marts 2026 frigav Andrej Karpathy — tidligere Tesla AI-direktør og OpenAI-medstifter — et repo, der satte gang i AI-verdenen: autoresearch.

Idéen er bedragerisk simpel: giv en AI-agent en lille men reel LLM-træningsopsætning, og lad den køre eksperimenter autonomt hen over natten. Den modificerer koden, træner i 5 minutter, tjekker om resultatet forbedrede sig, beholder eller kasserer ændringen, og gentager.

100 eksperimenter mens du sover. Nul menneskelig indgriben.

Men her er den del, der er vigtig for fremtiden for programmering: mennesket skriver ikke Python. Mennesket skriver en Markdown-fil.

Hvad er program.md?

I hjertet af autoresearch er en fil kaldet program.md. Det er et Markdown-dokument, der fungerer som instruktionsmanual til AI-agenten.

I stedet for manuelt at justere hyperparametre, læringsrater eller modificere neurale netværksarkitekturer i Python, skriver forskeren instruktioner på naturligt sprog i program.md. AI-agenten læser disse instruktioner og modificerer autonom trænerkoden (train.py) baseret på dem.

Som Karpathy formulerede det: du rører ikke ved nogen af Python-filerne, som du normalt ville som forsker. I stedet programmerer du program.md Markdown-filerne, der giver kontekst til AI-agenterne.

Hvordan autoresearch virker

Systemet er elegant i sin enkelhed:

  1. Mennesket redigerer program.md — sætter forskningsmål, begrænsninger og strategi
  2. AI-agenten (Claude, Codex eller en anden LLM) læser program.md og modificerer train.py
  3. Træning kører i præcis 5 minutter og måler valideringstab (val_bpb)
  4. Hvis forbedret, gemmes ændringen som et git commit på en feature-branch
  5. Hvis ikke forbedret, resetter git tilbage til udgangspunktet
  6. Gentag på ubestemt tid

Hele træningskodebasen er ~630 linjer Python — lille nok til at passe helt inden for en LLMs kontekstvindue. Dette er by design. Agenten skal forstå hele systemet for at kunne lave intelligente modifikationer.

Resultaterne

Karpathy lod autoresearch køre i ca. to dage på en dybde-12 model. AI-agenten opdagede autonomt omkring 20 forbedringer, der reducerede Time to GPT-2 benchmark fra 2,02 timer til 1,80 timer — en forbedring på 11% med nul menneskelig indgriben.

Hvert punkt i visualiseringen repræsenterer en komplet LLM-træningskørsel. Agenten arbejder i en autonom løkke og akkumulerer git commits, efterhånden som den finder bedre indstillinger for den neurale netværksarkitektur, optimizer og hyperparametre.

Hvorfor program.md er vigtigt ud over ML-forskning

Autoresearch handler om ML-træning, men det mønster, det introducerer, er universelt: programmering af AI-agenter med Markdown-filer.

Dette er ikke en isoleret idé. Se på, hvad der sker på tværs af AI-økosystemet:

FilFormål
program.mdProgrammerer autonome forskningsagenter (Karpathy)
AGENTS.mdProgrammerer AI-kodningsagenter (60K+ repos, Linux Foundation)
CLAUDE.mdProgrammerer Claude Code-adfærd
.cursorrulesProgrammerer Cursor AI-adfærd
llms.txtProgrammerer, hvordan AI-crawlere forstår websites

Mønsteret er identisk hver gang: et menneske skriver en Markdown-fil, og en AI-agent bruger den som instruktioner til at operere autonomt.

Markdown er blevet programmeringssprog for AI-agenter.

Fra vibe coding til agentic engineering

Karpathy selv skabte begrebet “vibe coding” i 2025 — idéen om at skrive kode ved at beskrive hensigt frem for syntaks. Men i begyndelsen af 2026 sagde han, at vibe coding allerede er passé.

Det nye begreb? Agentic engineering: du skriver ikke kode direkte 99% af tiden. Du orkestrerer agenter, der gør det, og fungerer som tilsyn.

Autoresearch er det reneste udtryk for denne idé. Forskerens job skifter fra “hvor mange eksperimenter kørte du i dag?” til “hvor gode var de eksperimentretninger, du satte?” Markdown-filen er, hvordan du sætter disse retninger.

Hvad dette betyder for vidensarbejdere

Du behøver ikke at træne LLM’er for at lære af autoresearch. Mønsteret gælder overalt:

  • Udviklere skriver AGENTS.md til at dirigere AI-kodningsassistenter
  • Forskere skriver program.md til at dirigere autonome eksperimenter
  • Indholdsskabere skriver prompts til at dirigere AI-skriveassistenter
  • Analytikere skriver instruktioner til at dirigere AI-databehandlingspipelines

I alle tilfælde bliver menneskets job: skrive de bedst mulige Markdown-instruktioner. AI’en håndterer udførelsen.

Opbyg din Markdown-første arbejdsgang

Hvis Markdown er ved at blive den universelle grænseflade for AI-agenter, er det at have rene Markdown-versioner af dit referencemateriale essentielt.

Når du skriver en program.md til autoresearch eller en AGENTS.md til din kodebase, trækker du fra dokumentation, artikler, blogindlæg og eksempler, du har set på nettet. Save lader dig fange alt det som ren Markdown med ét klik — klar til at referere, citere eller indføre i dine agentinstruktioner.

Arbejdsgangen: find noget nyttigt på nettet, gem det som Markdown med Save, brug det til at skrive bedre agentinstruktioner.


Save konverterer enhver webside til ren Markdown — det format AI-agenter forstår bedst. Byg dit referencebibliotek til at skrive bedre AI-instruktioner. Prøv Save gratis.