No desenvolvimento de software tradicional, um git commit significa “este código funciona.” No autoresearch de Karpathy, um git commit significa algo diferente: “esta mudança tornou o modelo mensuravelmente melhor.”

Cada commit é uma pequena descoberta científica. Cada git reset é uma hipótese que não se sustentou. O git log se torna um diário de pesquisa, escrito automaticamente por um agente AI.

Este é o controle de versão reimaginado como uma ferramenta de pesquisa.

A Decisão Binária

O uso de git pelo autoresearch é elegantemente simples:

Agente modifica train.py
Treinamento roda por 5 minutos
A perda de validação é medida
Se melhorou: git commit --- a mudança é mantida
Se não melhorou: git reset --- a mudança nunca aconteceu

Sem pull requests. Sem revisão de código. Sem conflitos de merge. Apenas uma decisão binária: essa mudança tornou as coisas melhores ou não?

Isso cria um histórico limpo e linear de melhorias. Cada commit no log representa um passo validado para frente. Sem ruído --- sem commits “WIP”, sem commits “fix typo”, sem cadeias “revert revert”. Apenas uma sequência de mudanças que cada uma tornou o modelo mensuravelmente melhor.

O Git Log como Diário de Pesquisa

Após uma sessão overnight de autoresearch, o git log se lê como um caderno de pesquisa:

Cada mensagem de commit (escrita pelo agente AI) descreve o que foi mudado e que efeito teve. O diff mostra exatamente qual código foi modificado. A melhoria na perda de validação é registrada.

Isso é radicalmente mais auditável que a pesquisa ML tradicional. Em vez de notas de um pesquisador dizendo “tentei ajustar a taxa de aprendizado, pareceu ajudar,” você tem um diff exato, uma medição exata e um resultado reproduzível.

Memória Entre Sessões

Git dá ao autoresearch algo que agentes AI precisam desesperadamente: memória persistente.

Quando você inicia uma nova sessão de autoresearch, o agente pode ler o histórico git para entender o que foi tentado antes. Ele pode ver quais direções produziram melhorias e quais não. Isso impede o agente de re-tentar experimentos fracassados e o ajuda a construir sobre o que funcionou.

Isso é Markdown e git trabalhando juntos: o arquivo program.md fornece direção estratégica (o que tentar), e o histórico git fornece contexto tático (o que foi tentado).

O Efeito Composto

Como cada commit bem-sucedido se torna a nova linha de base, as melhorias se compõem. O agente não começa do zero cada noite --- começa do melhor resultado alcançado até agora.

Na execução de dois dias de Karpathy, cerca de 20 melhorias se acumularam. Cada uma era pequena, mas juntas reduziram o tempo de treinamento do GPT-2 em 11%. O agente encontrou otimizações em escalonamento de atenção, regularização e hiperparâmetros que se construíram umas sobre as outras.

Esse é o poder da abordagem baseada em git: ela cria naturalmente um catraca. O progresso é travado como commits. Fracassos são descartados. O codebase só avança.

O Que é Revertido

Os experimentos fracassados --- as operações git reset --- são tão interessantes quanto os sucessos. Em uma execução overnight típica, cerca de 70-80% dos experimentos são revertidos.

Esses experimentos revertidos não são desperdiçados. São resultados negativos que informam as futuras decisões do agente. Com memória cross-agente e histórico git compartilhado, um sistema de autoresearch distribuído pode aprender com fracassos em todo o enxame.

Git como Banco de Dados de Experimentos

A pesquisa ML tradicional usa ferramentas de rastreamento de experimentos --- MLflow, Weights & Biases, Neptune --- para registrar hiperparâmetros, métricas e artefatos.

Autoresearch substitui tudo isso com git. O histórico de commits É o log de experimentos. Os diffs SÃO as mudanças de hiperparâmetros. As mensagens de commit SÃO as descrições dos experimentos.

Essa simplificação é poderosa. Não há banco de dados de experimentos separado para manter. Nenhum painel para configurar. Nenhum esquema para definir. Apenas git, que todo desenvolvedor já conhece.

O Padrão Mais Amplo

O padrão git-como-diário-de-pesquisa funciona além do treinamento ML:

Otimização de código: Cada commit representa uma mudança que tornou o código mais rápido
Cobertura de testes: Cada commit representa uma mudança que melhorou a cobertura de testes
Correção de bugs: Cada commit representa uma correção que resolveu um teste com falha
Otimização de conteúdo: Cada commit representa uma mudança que melhorou uma métrica mensurável

Qualquer domínio onde você pode medir automaticamente “melhor” e “pior” pode usar git como rastreador de experimentos.

O Papel do Humano: Ler o Log

Na engenharia agêntica, a rotina matinal do humano após uma sessão overnight de autoresearch é ler o git log.

Essa é uma habilidade diferente de escrever código. Você está avaliando uma série de mudanças geradas por AI, entendendo por que cada uma funcionou, e decidindo se a direção geral está correta. Com base nessa revisão, você atualiza seu program.md para guiar a próxima sessão.

O git log é o canal de comunicação entre humano e agente. O agente se comunica através de commits. O humano se comunica através das atualizações do program.md. Markdown flui em ambas as direções.

Construindo Conhecimento Compatível com Git

Escrever arquivos program.md eficazes --- o tipo que produz históricos git limpos e significativos --- requer entender tanto o domínio quanto as ferramentas. As melhores instruções para agentes vêm de pessoas que estudaram profundamente o espaço do problema.

Salvar material de referência como Markdown limpo cria uma base de conhecimento da qual você pode extrair ao escrever instruções para agentes. Documentação, papers de pesquisa e melhores práticas, todos no formato que flui naturalmente para um program.md e, em última análise, para um histórico git de descobertas.

Save converte qualquer página web para Markdown limpo --- construindo a biblioteca de conhecimento que alimenta instruções eficazes para agentes AI e pesquisa autônoma. Experimente o Save gratuitamente.