Autoresearch & PROGRAM.md de Karpathy: AI que Executa Experimentos Enquanto Você Dorme
Em 7 de março de 2026, Andrej Karpathy — ex-diretor de AI da Tesla e co-fundador da OpenAI — publicou um repositório que agitou o mundo da AI: autoresearch.
A ideia é enganosamente simples: dê a um agente AI um setup pequeno mas real de treinamento de LLM e deixe-o executar experimentos autonomamente durante a noite. Ele modifica o código, treina por 5 minutos, verifica se o resultado melhorou, mantém ou descarta a mudança e repete.
100 experimentos enquanto você dorme. Zero intervenção humana.
Mas aqui está a parte que importa para o futuro da programação: o humano não escreve Python. O humano escreve um arquivo Markdown.
O que é program.md?
No coração do autoresearch está um arquivo chamado program.md. É um documento Markdown que serve como manual de instruções para o agente AI.
Em vez de ajustar hiperparâmetros manualmente, alterar learning rates ou modificar arquiteturas de redes neurais em Python, o pesquisador escreve instruções em linguagem natural no program.md. O agente AI lê essas instruções e modifica autonomamente o código de treinamento (train.py) com base nelas.
Como Karpathy colocou: você não está tocando em nenhum dos arquivos Python como faria normalmente como pesquisador. Em vez disso, você está programando os arquivos Markdown program.md que fornecem contexto para os agentes AI.
Como o Autoresearch Funciona
O sistema é elegante em sua simplicidade:
- O humano edita
program.md— definindo objetivos de pesquisa, restrições e estratégia - O agente AI (Claude, Codex ou outro LLM) lê
program.mde modificatrain.py - O treinamento roda por exatamente 5 minutos, medindo a validation loss (val_bpb)
- Se melhorou, a mudança é mantida como git commit em um feature branch
- Se não melhorou, o git reseta para onde estava
- Repete indefinidamente
Todo o codebase de treinamento tem cerca de 630 linhas de Python — pequeno o suficiente para caber inteiramente na context window de um LLM. Isso é proposital. O agente precisa entender o sistema inteiro para fazer modificações inteligentes.
Os Resultados
Karpathy deixou o autoresearch rodando por cerca de dois dias em um modelo depth-12. O agente AI descobriu autonomamente cerca de 20 melhorias que reduziram o benchmark Time to GPT-2 de 2,02 horas para 1,80 horas — uma melhoria de 11% com zero intervenção humana.
Cada ponto na visualização representa uma rodada de treinamento completa de LLM. O agente trabalha em um loop autônomo, acumulando git commits à medida que encontra melhores configurações para a arquitetura da rede neural, otimizador e hiperparâmetros.
Por Que program.md Importa Além da Pesquisa em ML
O autoresearch é sobre treinamento de ML, mas o padrão que ele introduz é universal: programar agentes AI com arquivos Markdown.
Esta não é uma ideia isolada. Veja o que está acontecendo no ecossistema de AI:
| Arquivo | Propósito |
|---|---|
program.md | Programa agentes de pesquisa autônomos (Karpathy) |
AGENTS.md | Programa agentes AI de coding (60K+ repos, Linux Foundation) |
CLAUDE.md | Programa o comportamento do Claude Code |
.cursorrules | Programa o comportamento do Cursor AI |
llms.txt | Programa como os crawlers de AI entendem sites |
O padrão é idêntico toda vez: um humano escreve um arquivo Markdown, e um agente AI o usa como instruções para operar autonomamente.
Markdown se tornou a linguagem de programação para agentes AI.
Do Vibe Coding ao Agentic Engineering
O próprio Karpathy cunhou “vibe coding” em 2025 — a ideia de escrever código descrevendo intenção em vez de sintaxe. Mas no início de 2026, ele disse que vibe coding já é coisa do passado.
O novo termo? Agentic engineering: você não está escrevendo código diretamente em 99% do tempo. Você está orquestrando agentes que fazem isso, e agindo como supervisor.
O autoresearch é a expressão mais pura dessa ideia. O trabalho do pesquisador muda de “quantos experimentos você executou hoje?” para “quão boas foram as direções de experimento que você definiu?” O arquivo Markdown é como você define essas direções.
O que Isso Significa para Trabalhadores do Conhecimento
Você não precisa treinar LLMs para aprender com o autoresearch. O padrão se aplica em todos os lugares:
- Desenvolvedores escrevem AGENTS.md para direcionar assistentes de coding AI
- Pesquisadores escrevem program.md para direcionar experimentos autônomos
- Criadores de conteúdo escrevem prompts para direcionar assistentes de escrita AI
- Analistas escrevem instruções para direcionar pipelines AI de processamento de dados
Em todos os casos, o trabalho do humano está se tornando: escrever as melhores instruções Markdown possíveis. A AI cuida da execução.
Construindo Seu Workflow Markdown-First
Se Markdown está se tornando a interface universal para agentes AI, ter versões Markdown limpas do seu material de referência se torna essencial.
Quando você está escrevendo um program.md para autoresearch ou um AGENTS.md para seu codebase, você está buscando documentação, papers, posts de blog e exemplos que viu na web. Save permite capturar tudo isso como Markdown limpo com um clique — pronto para referenciar, excertar ou incluir nas suas instruções para agentes.
O workflow: encontre algo útil na web, salve como Markdown com o Save, use para escrever melhores instruções para agentes.
Save converte qualquer página web em Markdown limpo — o formato que os agentes AI melhor entendem. Construa sua biblioteca de referência para escrever melhores instruções de AI. Experimente o Save gratuitamente.