Autoresearch & PROGRAM.md di Karpathy: AI che Esegue Esperimenti Mentre Dormi
Il 7 marzo 2026, Andrej Karpathy — ex direttore AI di Tesla e co-fondatore di OpenAI — ha pubblicato una repo che ha acceso il mondo dell’AI: autoresearch.
L’idea è ingannevolmente semplice: dai a un agente AI un piccolo ma reale setup di training LLM e lascialo eseguire esperimenti autonomamente durante la notte. Modifica il codice, si allena per 5 minuti, controlla se il risultato è migliorato, mantiene o scarta la modifica e ripete.
100 esperimenti mentre dormi. Zero intervento umano.
Ma ecco la parte che conta per il futuro della programmazione: il programmatore non scrive Python. Il programmatore scrive un file Markdown.
Cos’è program.md?
Al cuore di autoresearch c’è un file chiamato program.md. È un documento Markdown che funge da manuale di istruzioni per l’agente AI.
Invece di regolare manualmente gli iperparametri, modificare i learning rate o cambiare le architetture di reti neurali in Python, il ricercatore scrive istruzioni in linguaggio naturale in program.md. L’agente AI legge queste istruzioni e modifica autonomamente il codice di training (train.py) sulla loro base.
Come ha detto Karpathy: non stai toccando nessuno dei file Python come faresti normalmente come ricercatore. Invece, stai programmando i file Markdown program.md che forniscono contesto agli agenti AI.
Come Funziona Autoresearch
Il sistema è elegante nella sua semplicità:
- Il ricercatore modifica
program.md— impostando obiettivi di ricerca, vincoli e strategia - L’agente AI (Claude, Codex o un altro LLM) legge
program.mde modificatrain.py - Il training viene eseguito per esattamente 5 minuti, misurando la validation loss (val_bpb)
- Se migliorato, la modifica viene mantenuta come git commit su un feature branch
- Se non migliorato, git torna allo stato precedente
- Ripete indefinitamente
L’intero codebase di training è di circa 630 righe di Python — abbastanza piccolo da stare interamente nella context window di un LLM. Questo è intenzionale. L’agente deve capire l’intero sistema per fare modifiche intelligenti.
I Risultati
Karpathy ha lasciato girare autoresearch per circa due giorni su un modello depth-12. L’agente AI ha scoperto autonomamente circa 20 miglioramenti che hanno ridotto il benchmark Time to GPT-2 da 2,02 ore a 1,80 ore — un miglioramento dell’11% senza intervento umano.
Ogni punto nella visualizzazione rappresenta un training run completo di LLM. L’agente lavora in un loop autonomo, accumulando git commit man mano che trova impostazioni migliori per l’architettura della rete neurale, l’optimizer e gli iperparametri.
Perché program.md È Importante Oltre la Ricerca ML
Autoresearch riguarda il training ML, ma il pattern che introduce è universale: programmare agenti AI con file Markdown.
Non è un’idea isolata. Guarda cosa sta succedendo nell’ecosistema AI:
| File | Scopo |
|---|---|
program.md | Programma agenti di ricerca autonomi (Karpathy) |
AGENTS.md | Programma agenti AI di coding (60K+ repo, Linux Foundation) |
CLAUDE.md | Programma il comportamento di Claude Code |
.cursorrules | Programma il comportamento di Cursor AI |
llms.txt | Programma come i crawler AI comprendono i siti web |
Il pattern è identico ogni volta: un umano scrive un file Markdown e un agente AI lo usa come istruzioni per operare autonomamente.
Markdown è diventato il linguaggio di programmazione per gli agenti AI.
Dal Vibe Coding all’Agentic Engineering
Karpathy stesso ha coniato il termine “vibe coding” nel 2025 — l’idea di scrivere codice descrivendo l’intento piuttosto che la sintassi. Ma all’inizio del 2026, ha detto che il vibe coding è già passato di moda.
Il nuovo termine? Agentic engineering: non scrivi codice direttamente nel 99% dei casi. Orchestri agenti che lo fanno, e agisci come supervisore.
Autoresearch è l’espressione più pura di questa idea. Il lavoro del ricercatore passa da “quanti esperimenti hai eseguito oggi?” a “quanto erano buone le direzioni degli esperimenti che hai impostato?” Il file Markdown è il modo in cui imposti quelle direzioni.
Cosa Significa per i Knowledge Worker
Non devi allenare LLM per imparare da autoresearch. Il pattern si applica ovunque:
- Sviluppatori scrivono AGENTS.md per dirigere assistenti AI di coding
- Ricercatori scrivono program.md per dirigere esperimenti autonomi
- Content creator scrivono prompt per dirigere assistenti di scrittura AI
- Analisti scrivono istruzioni per dirigere pipeline AI di elaborazione dati
In ogni caso, il lavoro dell’umano sta diventando: scrivere le migliori possibili istruzioni Markdown. L’AI gestisce l’esecuzione.
Costruire il Tuo Workflow Markdown-First
Se Markdown sta diventando l’interfaccia universale per gli agenti AI, avere versioni Markdown pulite del tuo materiale di riferimento diventa essenziale.
Quando stai scrivendo un program.md per autoresearch o un AGENTS.md per il tuo codebase, stai attingendo da documentazione, paper, post di blog ed esempi che hai visto sul web. Save ti permette di catturare tutto ciò come Markdown pulito con un solo clic — pronto da consultare, citare o inserire nelle tue istruzioni per agenti.
Il workflow: trova qualcosa di utile sul web, salvalo come Markdown con Save, usalo per scrivere istruzioni migliori per gli agenti.
Save converte qualsiasi pagina web in Markdown pulito — il formato che gli agenti AI capiscono meglio. Costruisci la tua libreria di riferimento per scrivere istruzioni AI migliori. Prova Save gratis.