Andrej Karpathy’nin autoresearch’ü, iyi yazılmış bir Markdown dosyasının AI ajanlarını gece boyunca gerçek bilimsel keşifler yapmaya yönlendirebileceğini kanıtladı. Ancak tüm program.md dosyaları eşit değildir.

Markdown talimatlarınızın kalitesi, AI ajanının çıktısının kalitesini doğrudan belirler. Belirsiz bir program.md rastgele, yönsüz deneyler üretir. Kesin bir tane ise biriken odaklı iyileştirmeler üretir.

İşte gerçekten işe yarayan bir program.md nasıl yazılır.

İyi bir program.md’nin Yapısı

İster ML araştırması yapıyor olun ister ajan yönlendirmeli başka bir iş, her etkili program.md’nin beş bölüme ihtiyacı vardır.

1. Bağlam: Ajanın Neyi Bilmesi Gerekir?

Ajan, projeniz hakkında sıfır anlayışla başlar. İlk göreviniz, akıllıca kararlar alabilmesi için yeterli bağlam vermektir.

Dahil edilecekler:

Projenin ne yaptığı
Kod tabanının nasıl göründüğü
Anahtar dosyalar ve amaçları
Alana özgü terminoloji
Mevcut durum ve bilinen sorunlar

Atlanacaklar:

LLM’in zaten bildiği açık bilgiler
Koddan okuyabileceği uygulama detayları
Mevcut kararları etkilemeyen geçmiş

2. Hedefler: Ajan Ne Optimize Etmeli?

Bu en kritik bölümdür. Ajanın net, ölçülebilir bir hedefi olması gerekir.

Autoresearch’te hedef basittir: val_bpb’yi (doğrulama bit/byte) azaltmak. Ajan bunu her 5 dakikalık eğitim koşusundan sonra ölçebilir.

Kendi projeleriniz için başarıyı ajanın değerlendirebileceği terimlerle tanımlayın:

“Sayfa yükleme süresini 2 saniyenin altına düşür”
“Test kapsamını %80’in üzerine çıkar”
“Bundle boyutunu en az %15 azalt”

“Kodu daha iyi yap” gibi belirsiz hedefler belirsiz sonuçlar üretir. Ölçülebilir hedefler odaklanmış iyileştirmeler üretir.

3. Kısıtlamalar: Ajan Ne Yapmamalı?

Kısıtlamalar hedefler kadar önemlidir. Olmadan ajan istemediğiniz yaratıcı çözümler bulabilir — örneğin derleme hızını “iyileştirmek” için tüm testleri silmek gibi.

Yaygın kısıtlamalar:

Test dosyalarını veya değerlendirme kodunu değiştirme
Genel API’yi değiştirme
Yeni bağımlılıklar ekleme
Bellek bütçesini aşma
Kodu okunabilir ve sürdürülebilir tut

Autoresearch’te temel kısıtlama, yalnızca train.py’ın değiştirilebilmesidir. Veri hattı, değerlendirme kodu ve test seti kilitlidir. Bu, ajanın metrikleri manipüle etmesini önler.

4. Strateji: Ajan Probleme Nasıl Yaklaşmalı?

Burada alan uzmanlığınız parlıyor. Ajanın bilmediği şeyleri biliyorsunuz — hangi yönlerin umut verici, hangilerinin çıkmaz sokak olduğunu.

İyi strateji talimatları:

“Mimari değişikliklerden önce hiperparametre ayarıyla başla”
“Dikkat mekanizmasına odaklan — mevcut uygulama optimal olmayabilir”
“Önce düzenleme tekniklerini dene: dropout, ağırlık sönümü, katman normu”
“Eğitim süresini %10’dan fazla artıran değişikliklerden kaçın”

Kötü strateji talimatları:

“Her şeyi dene” (çok belirsiz)
“Öğrenme oranını 0.001’e değiştir” (çok spesifik — mikroyönetim yapıyorsunuz)

İdeal nokta, ajanın verimli sınırlar içinde keşfetmesine izin veren yönlendirici rehberliktir.

5. Değerlendirme: Ajan Başarıyı Nasıl Ölçmeli?

Ajanın değişikliklerinin yardımcı olup olmadığını nasıl ölçeceğini bilmesi gerekir. Autoresearch’te bu döngüye yerleştirilmiştir: val_bpb iyileşirse değişikliği koru. Değilse geri al.

Diğer bağlamlar için değerlendirme kriterlerinizi tanımlayın:

Hangi metrikler önemli?
Hangi eşik bir iyileştirme sayılır?
Ajan belirsiz sonuçları nasıl ele almalı?
Ajan ne zaman durmalı ve geri bildirmelidir?

Yaygın Hatalar

Çok Belirsiz Olmak

“Modeli daha iyi yap” ajana hiçbir yön vermez. “Daha iyi”nin ne anlama geldiğini, nasıl ölçüleceğini ve hangi yaklaşımların önce deneneceğini açıkça belirtin.

Çok Spesifik Olmak

“47. satırı 3e-4 öğrenme oranı kullanacak şekilde değiştir” agentic engineering’in amacını zayıflatır. Yön belirlemek için değil, uygulamayı dikte etmek için buradasınız. Ajanın keşfetmesine izin verin.

Kısıtlamaları Unutmak

Kısıtlamalar olmadan ajanlar en az dirençli yolu bulur — bu genellikle istediğiniz şey değildir. “Eğitim süresini azalt” denilen bir ajan, siz aksi belirtmezseniz eğitim verilerinin yarısını atlayabilir.

Yinelememek

İlk program.md’niz mükemmel olmayacak. Ajanın ne yaptığını izleyin, nerede yanlış gittiğini görün ve talimatlarınızı güncelleyin. En iyi program.md dosyaları düzinelerce yineleme boyunca gelişir.

Yineleme Döngüsü

program.md yazmak tek seferlik bir süreç değildir. Bir döngüdür:

Yazın ilk program.md’nizi
Çalıştırın ajanı
Gözden geçirin ajanın ne yaptığını
Güncelleyin neyin işe yarayıp yaramadığına göre talimatlarınızı
Tekrarlayın

Her yineleme talimatlarınızı daha kesin hale getirir. Birkaç turdan sonra, tutarlı biçimde iyi sonuçlar üreten bir program.md’niz olacak.

Bu, agentic engineering’in temel becerisidir: kod yazmak değil, yineleme yoluyla giderek daha etkili ajan talimatları yazmak.

Referans Kütüphanenizi Oluşturun

En iyi program.md dosyaları yoktan çıkmaz. Bunlar alan hakkında derin bilgiye dayanır — belgeler, makaleler, en iyi uygulamalar ve örnekler.

Web’de yararlı referans materyali bulduğunuzda, Markdown olarak kaydedin. Ardından program.md’nizi yazarken ilgili bağlamı çekebilir, belirli teknikleri atıfta bulunabilir ve ajana ihtiyaç duyduğu arka plan bilgisini verebilirsiniz.

Autoresearch’ten en iyi sonuçları alan araştırmacılar sadece iyi yazarlar değildir. Bunlar, açık ajan talimatlarına sentezleyebildikleri iyi organize edilmiş referans materyaline sahip alan uzmanlarıdır.

Save, her web sayfasını temiz Markdown’a dönüştürür — etkili program.md dosyalarını destekleyen referans kütüphanesini oluşturmak için mükemmel. Save’i ücretsiz deneyin.