Herkes için Autoresearch: Uyurken 100 AI Deneyi Nasıl Çalıştırılır
Tek bir GPU’da, tek bir satır kod yazmadan bir gecede 100 makine öğrenmesi deneyi çalıştırabilseydiniz ne olurdu?
Andrej Karpathy’nin autoresearch’ü tam olarak bunu yapıyor. 7 Mart 2026’da yayımlanan bu 630 satırlık Python betiği, AI ajanlarının eğitim kodunu özerk olarak değiştirmesine, deneyler çalıştırmasına, sonuçları değerlendirmesine ve siz uyurken iyileşmeye devam etmesine olanak tanıyor.
İki gün içinde duyurunun milyonlarca görüntülenmesi oldu. Araştırmacılar, geliştiriciler ve şirketler kendi gecelik deneylerini çoktan çalıştırıyordu.
İşte nasıl çalıştığı ve neden önemli olduğu.
Temel Döngü
Autoresearch’ün tasarımı zarif bir şekilde basittir:
program.mddosyasını oku (Markdown talimatlarınız)- Bu talimatlara dayanarak
train.py’yi değiştir - Tam olarak 5 dakika eğit
- Sonucu ölç (doğrulama kaybı)
- Sakla veya at — metrik iyileştiyse commit et; iyileşmediyse git reset
- Süresiz olarak tekrarla
Saatte yaklaşık 12 deneyle, bir gecelik oturumda yaklaşık 100 deney elde edersiniz. Her başarılı iyileştirme bir öncekinin üzerine inşa edilerek bileşik bir etki yaratır.
Neye İhtiyaç Duyarsınız
Giriş engelekleri şaşırtıcı derecede düşük:
- Bir GPU — tüm sistem tek GPU eğitimi için tasarlandı
- 630 satır Python — herhangi bir LLM’in bağlam penceresine sığacak kadar küçük
- Bir LLM API anahtarı — Claude, GPT veya başka yetenekli bir model
- Bir
program.mddosyası — ajana neyi optimize etmesi gerektiğini söyleyen Markdown talimatlarınız
Hepsi bu. Küme yok. Dağıtık eğitim kurulumu yok. ML mühendislik ekibi yok. Bir kişi, bir GPU, bir Markdown dosyası.
Gerçek Sonuçlar
Karpathy, autoresearch’ü derinlik-12 modelinde yaklaşık iki gün boyunca çalıştırdı. AI ajanı özerk olarak yaklaşık 20 iyileştirme keşfetti:
- GPT-2 kıyaslaması için eğitim süresi 2,02 saatten 1,80 saate düştü
- Sıfır insan müdahalesiyle %11’lik iyileştirme
- Ajan, insanların gözden kaçırdığı sorunları buldu: uygun ölçekleme eksik dikkat mekanizmaları, eksik düzenlileştirme ve suboptimal hiperparametreler
Temel içgörü: ajan, deneyimli ML araştırmacılarının fark etmediği şeyleri keşfetti. Daha akıllı olduğu için değil, bir insanın 5 deneyebileceği yerde 100 varyasyonu deneyebildiği için.
630 Satırın Önemi
Kod tabanı kasıtlı olarak küçüktür. ~630 satırla, train.py dosyasının tamamı bir LLM’in bağlam penceresine sığar. Bu kritik bir tasarım kararıdır.
Ajan tüm sistemi aynı anda görebiliyorsa, akıllı değişiklikler yapabilir. Öğrenme hızının toplu iş boyutuyla nasıl etkileşime girdiğini, dikkat mekanizmasının çıktı katmanına nasıl bağlandığını, bir değişikliğin tüm eğitim boru hattına nasıl yayıldığını anlar.
Bir AI ajanına 50.000 satırlık bir kod tabanı verin ve global olarak anlam ifade etmeyebilecek yerel değişiklikler yapar. 630 satır verin ve tüm sistem hakkında muhakeme yapabilir.
5 Dakikalık Bütçe
Her deney tam olarak 5 dakika çalışır. Bu kısıtlama dahicedir:
Deneyleri karşılaştırılabilir kılar. Bir çalışma 3 dakika sürer, diğeri 20 dakika sürerse, sonuçlarını adil bir şekilde karşılaştıramazsınız. Sabit bir zaman bütçesi, her iyileştirmenin eşit koşullarda ölçülmesi anlamına gelir.
Hızlı iterasyonu mümkün kılar. 5 dakika, anlamlı eğitim ilerlemesi görmek için yeterince uzun ama saatte 12 deney çalıştırmak için yeterince kısa.
Kontrolden çıkan maliyetleri önler. Zaman sınırı olmadan, bir ajan tek bir umut verici değişikliği saatlerce eğitebilir. 5 dakikalık sınır, geri bildirim döngüsünü sıkı tutar.
Git Belleği
Her deney bir git commit’idir. Bu sisteme bellek kazandırır:
- Başarılı değişiklikler bir özellik dalında commit edilir, bir iyileştirme zinciri oluşturur
- Başarısız deneyler
git resetile geri alınır, iz bırakmaz - Geçmiş, neyin denendiğini, neyin işe yaradığını ve neyin yaramadığını tam olarak gösterir
Bu, ajanın çalışmasını bir dizi git commit olarak inceleyebileceğiniz anlamına gelir. Her commit mesajı, ajanın neyi değiştirdiğini ve neden değiştirdiğini açıklar. Özerk araştırmanın tam bir denetim izi.
ML’nin Ötesinde: Önemli Olan Desen
Autoresearch dil modelleri eğitmekle ilgilidir, ancak tanıttığı desen evrenseldir:
İnsan Markdown talimatları yazar → AI ajanı özerk olarak yürütür → Sonuçlar ölçülür ve saklanır/atılır → Döngü tekrarlar
Bu desen şunları yapabildiğiniz herhangi bir alan için işe yarar:
- Doğal dilde açık hedefler tanımlama
- Başarıyı otomatik olarak ölçme
- Sonuçlara dayanarak değişiklikleri saklama veya atma
Şirketler bu deseni ML araştırmasının ötesine — kod optimizasyonu, pazarlama deneyleri ve ürün geliştirmeye — çoktan uyguluyor.
Önce Markdown Yaklaşımı
Autoresearch’ün merkezinde bir Markdown dosyası var. Python değil. YAML değil. Bir GUI değil. Herkesin okuyup düzenleyebileceği düz bir metin dosyası.
Bu önemli çünkü AI araştırmayı yönlendirme engelini düşürüyor. Bir program.md yazmak için ML mühendisi olmanıza gerek yok. Sorunu, hedefleri ve kısıtlamaları anlamanız gerekiyor. Ajan uygulamayı halleder.
Beceri değişimi açık: eğitim kodu yazmayı bilmekten etkili ajan talimatları yazmayı bilmeye.
Başlarken
Autoresearch desenini denemek istiyorsanız (ML dışında bile), şu adımlarla başlayın:
- Metriğinizi tanımlayın. “Daha iyi” ne anlama gelir ve bunu otomatik olarak nasıl ölçersiniz?
- program.md’nizi yazın. Hedefleri, kısıtlamaları ve stratejiyi açık Markdown’da belirleyin.
- Kapsamı küçük tutun. Autoresearch’ün 630 satırlık kod tabanı gibi, daha küçük sistemler daha iyi sonuçlar verir.
- Çalışmasına izin verin. Nokta özerk operasyon. Müdahale etme dürtüsüne direnin.
- Sonuçları gözden geçirin. Ajanın neyi denediğini ve neyin işe yaradığını görmek için git geçmişini kontrol edin.
İyi Talimatlar Yazmak için Bilgi Oluşturma
program.md’nizin kalitesi alan bilginize bağlıdır. Problem uzayını ne kadar iyi anlarsanız, talimatlarınız o kadar iyi olur.
İşte burada Markdown formatında seçilmiş bir referans materyali kütüphanesine sahip olmak değerli hale gelir. Belgeler, makaleler, blog gönderileri ve örnekler — tümü temiz Markdown olarak kaydedilmiş, ajan talimatlarınızı bilgilendirmeye hazır.
Save, herhangi bir web sayfasını temiz Markdown’a dönüştürür — etkili AI ajan talimatları yazmak için ihtiyaç duyduğunuz referans kütüphanesini oluşturur. Save’i ücretsiz deneyin.