Tek bir GPU’da, tek bir satır kod yazmadan bir gecede 100 makine öğrenmesi deneyi çalıştırabilseydiniz ne olurdu?

Andrej Karpathy’nin autoresearch’ü tam olarak bunu yapıyor. 7 Mart 2026’da yayımlanan bu 630 satırlık Python betiği, AI ajanlarının eğitim kodunu özerk olarak değiştirmesine, deneyler çalıştırmasına, sonuçları değerlendirmesine ve siz uyurken iyileşmeye devam etmesine olanak tanıyor.

İki gün içinde duyurunun milyonlarca görüntülenmesi oldu. Araştırmacılar, geliştiriciler ve şirketler kendi gecelik deneylerini çoktan çalıştırıyordu.

İşte nasıl çalıştığı ve neden önemli olduğu.

Temel Döngü

Autoresearch’ün tasarımı zarif bir şekilde basittir:

program.md dosyasını oku (Markdown talimatlarınız)
Bu talimatlara dayanarak train.py’yi değiştir
Tam olarak 5 dakika eğit
Sonucu ölç (doğrulama kaybı)
Sakla veya at — metrik iyileştiyse commit et; iyileşmediyse git reset
Süresiz olarak tekrarla

Saatte yaklaşık 12 deneyle, bir gecelik oturumda yaklaşık 100 deney elde edersiniz. Her başarılı iyileştirme bir öncekinin üzerine inşa edilerek bileşik bir etki yaratır.

Neye İhtiyaç Duyarsınız

Giriş engelekleri şaşırtıcı derecede düşük:

Bir GPU — tüm sistem tek GPU eğitimi için tasarlandı
630 satır Python — herhangi bir LLM’in bağlam penceresine sığacak kadar küçük
Bir LLM API anahtarı — Claude, GPT veya başka yetenekli bir model
Bir program.md dosyası — ajana neyi optimize etmesi gerektiğini söyleyen Markdown talimatlarınız

Hepsi bu. Küme yok. Dağıtık eğitim kurulumu yok. ML mühendislik ekibi yok. Bir kişi, bir GPU, bir Markdown dosyası.

Gerçek Sonuçlar

Karpathy, autoresearch’ü derinlik-12 modelinde yaklaşık iki gün boyunca çalıştırdı. AI ajanı özerk olarak yaklaşık 20 iyileştirme keşfetti:

GPT-2 kıyaslaması için eğitim süresi 2,02 saatten 1,80 saate düştü
Sıfır insan müdahalesiyle %11’lik iyileştirme
Ajan, insanların gözden kaçırdığı sorunları buldu: uygun ölçekleme eksik dikkat mekanizmaları, eksik düzenlileştirme ve suboptimal hiperparametreler

Temel içgörü: ajan, deneyimli ML araştırmacılarının fark etmediği şeyleri keşfetti. Daha akıllı olduğu için değil, bir insanın 5 deneyebileceği yerde 100 varyasyonu deneyebildiği için.

630 Satırın Önemi

Kod tabanı kasıtlı olarak küçüktür. ~630 satırla, train.py dosyasının tamamı bir LLM’in bağlam penceresine sığar. Bu kritik bir tasarım kararıdır.

Ajan tüm sistemi aynı anda görebiliyorsa, akıllı değişiklikler yapabilir. Öğrenme hızının toplu iş boyutuyla nasıl etkileşime girdiğini, dikkat mekanizmasının çıktı katmanına nasıl bağlandığını, bir değişikliğin tüm eğitim boru hattına nasıl yayıldığını anlar.

Bir AI ajanına 50.000 satırlık bir kod tabanı verin ve global olarak anlam ifade etmeyebilecek yerel değişiklikler yapar. 630 satır verin ve tüm sistem hakkında muhakeme yapabilir.

5 Dakikalık Bütçe

Her deney tam olarak 5 dakika çalışır. Bu kısıtlama dahicedir:

Deneyleri karşılaştırılabilir kılar. Bir çalışma 3 dakika sürer, diğeri 20 dakika sürerse, sonuçlarını adil bir şekilde karşılaştıramazsınız. Sabit bir zaman bütçesi, her iyileştirmenin eşit koşullarda ölçülmesi anlamına gelir.

Hızlı iterasyonu mümkün kılar. 5 dakika, anlamlı eğitim ilerlemesi görmek için yeterince uzun ama saatte 12 deney çalıştırmak için yeterince kısa.

Kontrolden çıkan maliyetleri önler. Zaman sınırı olmadan, bir ajan tek bir umut verici değişikliği saatlerce eğitebilir. 5 dakikalık sınır, geri bildirim döngüsünü sıkı tutar.

Git Belleği

Her deney bir git commit’idir. Bu sisteme bellek kazandırır:

Başarılı değişiklikler bir özellik dalında commit edilir, bir iyileştirme zinciri oluşturur
Başarısız deneyler git reset ile geri alınır, iz bırakmaz
Geçmiş, neyin denendiğini, neyin işe yaradığını ve neyin yaramadığını tam olarak gösterir

Bu, ajanın çalışmasını bir dizi git commit olarak inceleyebileceğiniz anlamına gelir. Her commit mesajı, ajanın neyi değiştirdiğini ve neden değiştirdiğini açıklar. Özerk araştırmanın tam bir denetim izi.

ML’nin Ötesinde: Önemli Olan Desen

Autoresearch dil modelleri eğitmekle ilgilidir, ancak tanıttığı desen evrenseldir:

İnsan Markdown talimatları yazar → AI ajanı özerk olarak yürütür → Sonuçlar ölçülür ve saklanır/atılır → Döngü tekrarlar

Bu desen şunları yapabildiğiniz herhangi bir alan için işe yarar:

Doğal dilde açık hedefler tanımlama
Başarıyı otomatik olarak ölçme
Sonuçlara dayanarak değişiklikleri saklama veya atma

Şirketler bu deseni ML araştırmasının ötesine — kod optimizasyonu, pazarlama deneyleri ve ürün geliştirmeye — çoktan uyguluyor.

Önce Markdown Yaklaşımı

Autoresearch’ün merkezinde bir Markdown dosyası var. Python değil. YAML değil. Bir GUI değil. Herkesin okuyup düzenleyebileceği düz bir metin dosyası.

Bu önemli çünkü AI araştırmayı yönlendirme engelini düşürüyor. Bir program.md yazmak için ML mühendisi olmanıza gerek yok. Sorunu, hedefleri ve kısıtlamaları anlamanız gerekiyor. Ajan uygulamayı halleder.

Beceri değişimi açık: eğitim kodu yazmayı bilmekten etkili ajan talimatları yazmayı bilmeye.

Başlarken

Autoresearch desenini denemek istiyorsanız (ML dışında bile), şu adımlarla başlayın:

Metriğinizi tanımlayın. “Daha iyi” ne anlama gelir ve bunu otomatik olarak nasıl ölçersiniz?
program.md’nizi yazın. Hedefleri, kısıtlamaları ve stratejiyi açık Markdown’da belirleyin.
Kapsamı küçük tutun. Autoresearch’ün 630 satırlık kod tabanı gibi, daha küçük sistemler daha iyi sonuçlar verir.
Çalışmasına izin verin. Nokta özerk operasyon. Müdahale etme dürtüsüne direnin.
Sonuçları gözden geçirin. Ajanın neyi denediğini ve neyin işe yaradığını görmek için git geçmişini kontrol edin.

İyi Talimatlar Yazmak için Bilgi Oluşturma

program.md’nizin kalitesi alan bilginize bağlıdır. Problem uzayını ne kadar iyi anlarsanız, talimatlarınız o kadar iyi olur.

İşte burada Markdown formatında seçilmiş bir referans materyali kütüphanesine sahip olmak değerli hale gelir. Belgeler, makaleler, blog gönderileri ve örnekler — tümü temiz Markdown olarak kaydedilmiş, ajan talimatlarınızı bilgilendirmeye hazır.

Save, herhangi bir web sayfasını temiz Markdown’a dönüştürür — etkili AI ajan talimatları yazmak için ihtiyaç duyduğunuz referans kütüphanesini oluşturur. Save’i ücretsiz deneyin.