Autoresearch i PROGRAM.md Karpathy'ego: AI Prowadzące Eksperymenty Podczas Gdy Śpisz

7 marca 2026 roku Andrej Karpathy --- były dyrektor ds. AI w Tesla i współzałożyciel OpenAI --- opublikował repozytorium, które rozświetliło świat AI: autoresearch.

Pomysł jest deceptywnie prosty: daj agentowi AI małą, ale prawdziwą konfigurację treningową LLM i pozwól mu autonomicznie prowadzić eksperymenty przez noc. Modyfikuje kod, trenuje przez 5 minut, sprawdza czy wynik się poprawił, zachowuje lub odrzuca zmianę i powtarza.

100 eksperymentów podczas gdy śpisz. Zero interwencji człowieka.

Ale oto część, która ma znaczenie dla przyszłości programowania: człowiek nie pisze Pythona. Człowiek pisze plik Markdown.

Czym Jest program.md?

W sercu autoresearchu znajduje się plik o nazwie program.md. To dokument Markdown, który służy jako instrukcja obsługi dla agenta AI.

Zamiast ręcznie dostrajać hiperparametry, dostosowywać szybkości uczenia lub modyfikować architektury sieci neuronowych w Pythonie, badacz pisze instrukcje w naturalnym języku w program.md. Agent AI czyta te instrukcje i autonomicznie modyfikuje kod treningowy (train.py) na ich podstawie.

Jak ujął to Karpathy: nie dotykasz żadnych plików Python tak jak normalnie robiłbyś jako badacz. Zamiast tego programujesz pliki Markdown program.md, które dostarczają kontekstu agentom AI.

Jak Działa Autoresearch

System jest elegancki w swojej prostocie:

Człowiek edytuje program.md --- ustawia cele badawcze, ograniczenia i strategię
Agent AI (Claude, Codex lub inny LLM) czyta program.md i modyfikuje train.py
Trening działa przez dokładnie 5 minut, mierząc stratę walidacyjną (val_bpb)
Jeśli poprawiony, zmiana jest zachowana jako git commit na gałęzi feature
Jeśli nie poprawiony, git cofa się do punktu startowego
Powtarzaj w nieskończoność

Cała baza kodu treningowego to ~630 linii Pythona --- mała wystarczająco, aby zmieścić się w całości w oknie kontekstowym LLM. To jest zamierzone. Agent musi rozumieć cały system, aby dokonywać inteligentnych modyfikacji.

Wyniki

Karpathy pozostawił autoresearch działający przez około dwa dni na modelu depth-12. Agent AI autonomicznie odkrył około 20 ulepszeń, które zmniejszyły czas do benchmarku GPT-2 z 2,02 godziny do 1,80 godziny --- poprawa o 11% bez interwencji człowieka.

Każda kropka w wizualizacji reprezentuje pełne uruchomienie treningu LLM. Agent pracuje w autonomicznej pętli, gromadząc git commity, gdy znajduje lepsze ustawienia dla architektury sieci neuronowej, optymalizatora i hiperparametrów.

Dlaczego program.md Ma Znaczenie Poza Badaniami ML

Autoresearch dotyczy treningu ML, ale wzorzec, który wprowadza, jest uniwersalny: programowanie agentów AI plikami Markdown.

To nie jest izolowany pomysł. Spójrz, co dzieje się w ekosystemie AI:

Plik	Cel
`program.md`	Programuje autonomiczne agenty badawcze (Karpathy)
`AGENTS.md`	Programuje agenty kodowania AI (60K+ repo, Linux Foundation)
`CLAUDE.md`	Programuje zachowanie Claude Code
`.cursorrules`	Programuje zachowanie Cursor AI
`llms.txt`	Programuje sposób, w jaki crawlery AI rozumieją strony

Wzorzec jest identyczny za każdym razem: człowiek pisze plik Markdown, a agent AI używa go jako instrukcji do autonomicznego działania.

Markdown stał się językiem programowania agentów AI.

Od Vibe Coding do Inżynierii Agentowej

Karpathy sam wymyślił “vibe coding” w 2025 roku --- pomysł pisania kodu poprzez opisywanie intencji zamiast składni. Ale na początku 2026 roku powiedział, że vibe coding jest już passé.

Nowy termin? Inżynieria agentowa: 99% czasu nie piszesz kodu bezpośrednio. Orkiestrujesz agentów, którzy to robią, i działasz jako nadzór.

Autoresearch to najczystszy wyraz tej idei. Praca badacza przesuwa się od “ile eksperymentów przeprowadziłeś dziś?” do “jak dobre były kierunki eksperymentów, które ustawiłeś?” Plik Markdown to sposób, w jaki ustawiasz te kierunki.

Co To Oznacza dla Pracowników Wiedzy

Nie musisz trenować LLM-ów, aby uczyć się z autoresearchu. Wzorzec ma zastosowanie wszędzie:

Deweloperzy piszą AGENTS.md, aby kierować asystentami kodowania AI
Badacze piszą program.md, aby kierować autonomicznymi eksperymentami
Twórcy treści piszą prompty, aby kierować asystentami pisania AI
Analitycy piszą instrukcje, aby kierować potokami przetwarzania danych AI

W każdym przypadku praca człowieka staje się: pisanie jak najlepszych instrukcji Markdown. AI zajmuje się wykonaniem.

Budowanie Przepływu Pracy Markdown-first

Jeśli Markdown staje się uniwersalnym interfejsem dla agentów AI, posiadanie czystych wersji Markdown materiałów referencyjnych staje się niezbędne.

Gdy piszesz program.md dla autoresearchu lub AGENTS.md dla swojej bazy kodu, czerpiesz z dokumentacji, artykułów, postów na blogu i przykładów, które widziałeś w sieci. Save pozwala ci przechwytywać to wszystko jako czysty Markdown jednym kliknięciem --- gotowy do odwoływania się, cytowania lub wstawienia do instrukcji agentowych.

Przepływ pracy: znajdź coś użytecznego w sieci, zapisz jako Markdown za pomocą Save, użyj do pisania lepszych instrukcji agentowych.

Save konwertuje dowolną stronę internetową na czysty Markdown --- format, który agenty AI rozumieją najlepiej. Buduj swoją bibliotekę referencyjną do pisania lepszych instrukcji AI. Wypróbuj Save za darmo.

Autoresearch i PROGRAM.md Karpathy'ego: AI Prowadzące Eksperymenty Podczas Gdy Śpisz

Czym Jest program.md?

Jak Działa Autoresearch

Wyniki

Dlaczego program.md Ma Znaczenie Poza Badaniami ML

Od Vibe Coding do Inżynierii Agentowej

Co To Oznacza dla Pracowników Wiedzy

Budowanie Przepływu Pracy Markdown-first

## Continue reading

Jak Napisać Dobry program.md: Praktyczny Przewodnik po Instrukcjach dla Agentów AI

Autoresearch dla Wszystkich: Jak Uruchamiać 100 Eksperymentów AI Gdy Śpisz

Od README.md do PROGRAM.md: Markdown jest teraz językiem programowania

Od SETI@home do AgentHub: Wizja Karpathy'ego dla Rozproszonego Badania AI

Jean-Sébastien Wallez