Karpathys Autoresearch & PROGRAM.md: AI Som Kör Experiment Medan Du Sover
Den 7 mars 2026 publicerade Andrej Karpathy --- tidigare AI-direktör på Tesla och medgrundare av OpenAI --- ett repo som tände AI-världen: autoresearch.
Idén är bedrägligt enkel: ge en AI-agent en liten men riktig LLM-träningsinställning och låt den köra experiment autonomt över natten. Den modifierar koden, tränar i 5 minuter, kontrollerar om resultatet förbättrades, behåller eller kasserar förändringen, och upprepar.
100 experiment medan du sover. Noll mänsklig intervention.
Men här är den del som spelar roll för framtidens programmering: människan skriver inte Python. Människan skriver en Markdown-fil.
Vad Är program.md?
I hjärtat av autoresearch finns en fil kallad program.md. Det är ett Markdown-dokument som fungerar som instruktionsmanual för AI-agenten.
Istället för att manuellt justera hyperparametrar, lärningshastigheter eller neurala nätverksarkitekturer i Python skriver forskaren naturliga språkinstruktioner i program.md. AI-agenten läser dessa instruktioner och modifierar träningskoden (train.py) autonomt baserat på dem.
Som Karpathy uttryckte det: du rör ingen av Python-filerna som du normalt skulle göra som forskare. Istället programmerar du program.md Markdown-filerna som ger kontext till AI-agenterna.
Hur Autoresearch Fungerar
Systemet är elegant i sin enkelhet:
- Människan redigerar
program.md--- sätter forskningsmål, begränsningar och strategi - AI-agenten (Claude, Codex eller en annan LLM) läser
program.mdoch modifierartrain.py - Träning körs i exakt 5 minuter och mäter valideringsförlust (val_bpb)
- Om förbättrad, bevaras förändringen som en git-commit på en feature branch
- Om inte förbättrad, återställer git till startpunkten
- Upprepa hur länge som helst
Hela träningskodsbasen är ~630 rader Python --- liten nog att passa helt inom en LLMs kontextfönster. Detta är avsiktlig design. Agenten behöver förstå hela systemet för att göra intelligenta modifieringar.
Resultaten
Karpathy lät autoresearch köra i ungefär två dagar på en depth-12-modell. AI-agenten upptäckte autonomt ungefär 20 förbättringar som minskade Time to GPT-2-benchmark från 2,02 timmar till 1,80 timmar --- en förbättring med 11% utan mänsklig intervention.
Varje punkt i visualiseringen representerar en fullständig LLM-träningskörning. Agenten arbetar i en autonom loop och ackumulerar git-commits när den hittar bättre inställningar för den neurala nätverksarkitekturen, optimeraren och hyperparametrarna.
Varför program.md Spelar Roll Bortom ML-forskning
Autoresearch handlar om ML-träning, men mönstret det introducerar är universellt: programmera AI-agenter med Markdown-filer.
Det här är inte en isolerad idé. Titta på vad som händer i AI-ekosystemet:
| Fil | Syfte |
|---|---|
program.md | Programmerar autonoma forskningsagenter (Karpathy) |
AGENTS.md | Programmerar AI-kodningsagenter (60K+ repos, Linux Foundation) |
CLAUDE.md | Programmerar Claude Codes beteende |
.cursorrules | Programmerar Cursors AI-beteende |
llms.txt | Programmerar hur AI-crawlers förstår webbplatser |
Mönstret är identiskt varje gång: en människa skriver en Markdown-fil, och en AI-agent använder den som instruktioner för att operera autonomt.
Markdown har blivit programmeringsspråket för AI-agenter.
Från Vibe Coding till Agentisk Ingenjörskonst
Karpathy själv myntade “vibe coding” 2025 --- idén om att skriva kod genom att beskriva avsikt snarare än syntax. Men i tidig 2026 sa han att vibe coding redan är passé.
Det nya ordet? Agentisk ingenjörskonst: du skriver inte kod direkt 99% av tiden. Du orkestrerar agenter som gör det, och fungerar som tillsyn.
Autoresearch är det renaste uttrycket för den här idén. Forskarens jobb skiftar från “hur många experiment körde du idag?” till “hur bra var de experimentriktningar du satte?” Markdown-filen är hur du sätter dessa riktningar.
Vad Detta Innebär för Kunskapsarbetare
Du behöver inte träna LLMs för att lära dig av autoresearch. Mönstret gäller överallt:
- Utvecklare skriver AGENTS.md för att styra AI-kodningsassistenter
- Forskare skriver program.md för att styra autonoma experiment
- Innehållsskapare skriver prompter för att styra AI-skripassistenter
- Analytiker skriver instruktioner för att styra AI-databearbetningspipelines
I varje fall håller människans jobb på att bli: skriv de bästa möjliga Markdown-instruktionerna. AI:n hanterar utförandet.
Bygga Ditt Markdown-first Arbetsflöde
Om Markdown håller på att bli det universella gränssnittet för AI-agenter, är det viktigt att ha rena Markdown-versioner av ditt referensmaterial.
När du skriver en program.md för autoresearch eller en AGENTS.md för din kodbas hämtar du från dokumentation, artiklar, blogginlägg och exempel du sett på webben. Save låter dig fånga allt det som ren Markdown med ett klick --- redo att referera, citera eller mata in i dina agentinstruktioner.
Arbetsflödet: hitta något användbart på webben, spara det som Markdown med Save, använd det för att skriva bättre agentinstruktioner.
Save konverterar vilken webbsida som helst till ren Markdown --- formatet AI-agenter förstår bäst. Bygg ditt referensbibliotek för att skriva bättre AI-instruktioner. Prova Save gratis.