Karpathy 7 Mart 2026’da otoaraştırmayı yayınladığında, şirketlerin bunu kendi problemlerine uygulamaya başlaması haftalar değil, aylar değil — tam olarak günler aldı.

En dikkat çekici erken benimseyici: iç bir proje için otoaraştırma çerçevesini uyarlayan Shopify CEO’su Tobi Lutke. Sonuç? Gece boyunca eğitilen 0,8 milyar parametreli bir model, 8 saatte yalnızca 37 deneyin ardından önceki 1,6 milyar parametreli modeli %19 oranında geride bıraktı.

Daha küçük model. Daha iyi sonuçlar. Gece boyunca sıfır insan müdahalesi.

İş Dünyasında Otoaraştırma Modeli

Shopify’ın gösterdiği şey yalnızca şirin bir ML deneyi değil. Şirketlerin AR-GE yapma biçimi için yeni bir yaklaşımın kavram kanıtı.

Geleneksel yaklaşım: ML mühendisleri işe al, deneyleri elle yaptır, sonuçları toplantılarda incele, sonraki adımları belirle, yavaşça tekrarla. İyi bir ekip ayda 30 odaklı deney yapabilir.

Otoaraştırma yaklaşımı: hedeflerinizi tanımlayan bir program.md yazın, bir yapay zeka ajanının gece boyunca deneyler yapmasına izin verin, sabah sonuçları inceleyin. Bir mühendis, bir GPU, gecede 100’den fazla deney.

Matematik ezici. Manuel araştırma araştırmacı başına günde ~1 deney üretir. Otoaraştırma saatte ~12 üretir. Bu, deneysel verimde 100 kat artış demek.

ML’nin Ötesinde: 36.500 Deneylik Yıl

Model eğitiminin ötesinde de geçerli olan model. Pazarlama ekipleri genellikle yılda yaklaşık 30 deney yapar — A/B testleri, metin varyasyonları, kitle hedefleme değişiklikleri. Yavaş çünkü her deney insan kurulumu, izleme ve analiz gerektiriyor.

Erken benimseyenler, özerk ajanların günde 100 pazarlama deneyi yaptığı, dönüşüm oranlarını ölçtüğü, metni düzenlediği ve hedeflemeyi geliştirdiği bir dünyayı hayal ediyor — hepsi markanın hedeflerini ve kısıtlamalarını tanımlayan bir program.md rehberliğinde.

Bu, 30’a karşılık yılda 36.500’den fazla deney demek. Bu modeli ilk benimseyen şirketler, neredeyse yakalanması imkânsız bileşik bir avantaj elde edecek.

Shopify’ın Sonuçlarını Mümkün Kılan Şeyler

Shopify’ın %19 iyileştirmesi şans değildi. Birkaç faktör bunu mümkün kıldı:

Net metrikler. Her deneyden sonra ajanın otomatik olarak ölçebildiği iyi tanımlanmış bir değerlendirme metriği vardı. Otomatik ölçüm olmadan döngü bozulur.

Kısıtlı kapsam. Karpathy’nin 630 satırlık train.py’si gibi, Shopify da değiştirilebilir kod tabanını LLM’nin tamamen anlayabileceği kadar küçük tuttu. Bir milyon satırlık kod tabanını bir ajana atıp en iyisini ummuyorsunuz.

İyi başlangıç talimatları. Ajana rehberlik eden program.md, ekibin alan bilgisiyle şekillendi. Ajan rastgele aramıyordu — ekibin umut verici olarak belirlediği yönleri araştırıyordu.

Sürece güven. Müdahale etmeden gece boyunca çalışmasına izin verdiler. Her saat kontrol etme ve ayarlama isteği, özerk deneycilik amacını ortadan kaldırır.

Gece Çalıştırma Modeli

Tipik otoaraştırma benimsemesi bir modeli izler:

1. Gün: Ortamı kurun, ilk program.md’nizi yazın, döngünün çalıştığını doğrulamak için birkaç deneyi elle çalıştırın.

1. Gece: Ayrılmadan önce ajanı başlatın. Süresiz çalışacak, iyileştirmeleri kaydedecek ve hataları geri alacak şekilde ayarlayın.

2. Gün sabahı: Git günlüğünü inceleyin. Ajanın ne denediğini, neyin işe yarayıp yaramadığını görün. Öğrendiklerinize göre program.md’yi güncelleyin.

2. Gece: Geliştirilmiş talimatlarla tekrar çalıştırın. Ajan, 1. Gecenin en iyi sonucundan devam eder.

Bir hafta içinde: Bir insan ekibinin aylar içinde keşfedeceği onlarca doğrulanmış iyileştirmeye sahip, geliştirilmiş bir program.md’niz var.

Bu Modele Hazır Endüstriler

Sistematik deneycilik içeren herhangi bir alan otoaraştırma döngüsünü benimseyebilir:

Makine öğrenmesi — orijinal kullanım durumu. Hiperparametre ayarı, mimari arama, düzenleme deneyleri.

Yazılım optimizasyonu — performans ayarı, paket boyutu azaltma, sorgu optimizasyonu. Ölçülebilir bir metriğiniz ve değiştirilebilir kodunuz olduğu her yer.

İlaç keşfi — ölçülebilir bağlanma afinitesiyle moleküler simülasyonlar. Deney hesaplamalı, metrik sayısal, döngü otomatikleştirilebilir.

Finansal modelleme — tarihsel verilerle ticaret stratejilerinin geriye dönük testi. Net metrikler, hızlı geri bildirim, geniş arama alanı.

İçerik optimizasyonu — dönüşüm oranını metrik olarak kullanarak başlıklar, düzenler ve metin için A/B testi.

Markdown Avantajı

Her durumda insanın katkısı aynıdır: neyin optimize edileceğini, hangi kısıtlamalara uyulacağını ve hangi stratejilerin deneneceğini tanımlayan bir Markdown dosyası.

Markdown okuryazarlığının rekabet avantajı haline gelmesinin nedeni budur. En iyi program.md dosyalarını yazan şirketler, özerk ajanlardan en iyi sonuçları alanlardır. İyi program.md dosyaları yazmak ise yapay zekanın tüketebileceği bir formatta düzenlenmiş derin alan bilgisi gerektirir.

Referans kütüphaneleri oluşturan şirketler — belgeleri, rakip analizlerini, araştırma makalelerini ve en iyi uygulamaları temiz Markdown olarak kaydeden — bir adım önde. Gece deneyini yönlendirecek program.md’yi yazma zamanı geldiğinde, sıfırdan başlamak yerine küratörlü bir bilgi tabanından yararlanabilirler.

Save, herhangi bir web sayfasını temiz Markdown’a dönüştürür — şirketlerin etkili yapay zeka ajan talimatları yazması için gereken bilgi kütüphanesini oluşturur. Save’i ücretsiz deneyin.