Blog'a dön

Framework değil harness — AI araçlarının yeni şekli

· Save Team
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

18 Nisan 2026’da, Gregor Zunic — Browser Use kurucu ortağı — şunu paylaştı:

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

Framework yok. Doğrudan CDP. Chrome’a tek bir websocket. Agent’ın anlık olarak düzenlediği bir helpers.py. Claude Code ve Codex için drop-in. Tweet burada.

Bu sadece bir tarayıcı otomasyon aracı değil. 2026’da AI tooling’ini sessizce devralan bir örüntünün bugüne dek en net ifadesi: harness.

Harness nedir?

Harness, bir LLM’in çevresindeki, onun yararlı iş yapmasına imkân veren en asgari sarmal. Bir araç yüzeyi sunar — genellikle dosya sistemi, shell, belki HTTP — ve sonra çekilir.

İki formu karşılaştır:

FrameworkHarness
Workflow, adım, DAG tanımlarWorkflow yok. LLM karar verir.
Alttaki araçları soyutlayarak gizlerHam araçları açığa çıkarır (shell, CDP, fs)
Agent’ın ne yapması gerektiğini belirtirAgent’ın ne yapabildiğini belirtir
Görev şablona sığmazsa kırılırBükülür, çünkü şablon yoktur
Aptal modeller için optimizeAkıllı modeller için optimize

Framework’ler 2023’te mantıklıydı. Modeller ham yeteneklerle güvenilecek kadar sağlam değildi, bu yüzden raylar inşa ediyordunuz. LangChain, AutoGPT, CrewAI — hepsi “bu LLM’i bir pipeline üzerinden elinden tutayım” temasının varyasyonları.

Modeller akıllandı. Raylar tasarruftan çok maliyet yaratmaya başladı.

İlk gerçek harness Claude Code’du

Claude Code 2025 başında radikal bir tasarımla geldi: orkestrasyon yok, planner modülü yok, bellek grafı yok. Sadece Bash, Read, Edit, Write, Grep ve birkaç web aracına sahip bir LLM. Hepsi bu.

Bahis şuydu: yeterince akıllı bir model, dosya sistemi erişimi ve shell verildiğinde, orkestrasyonu kendi yapabilir. Ve yaptı. Karpathy buna “her gün gerçekten kullandığım tek AI aracı” dedi.

Codex birkaç ay sonra aynı forma oturdu. Farklı model, aynı felsefe: LLM’e bir kum havuzu ve araçlar ver, framework değil.

Browser Harness, bu örüntünün tarayıcı otomasyonuna gelişi. Selenium tarzı adım tanımları ya da agent iskelesiyle sarılmış Playwright tarzı API’ler yerine, ham bir Chrome DevTools Protocol bağlantısı ve agent’ın bir şey kırıldığında yeniden yazdığı bir helpers dosyası alıyorsun.

İşte “self-healing” kısmı bu. Retry mantığı yok, fallback stratejisi yok, hata durumu parser’ı yok. LLM hatayı okur, helper’ı düzenler, tekrar dener. Kod tabanı, belleğin kendisidir.

Harness’lar neden kazanıyor

Üç şey paralel kaydı:

  1. Araç kullanımı güvenilir hale geldi. Claude 4 ve GPT-5 araç şemalarını, bozuk çağrıları yakalayan bir validator katmanına ihtiyaç duyulmayacak kadar tutarlı bir biçimde takip ediyor.
  2. Bağlam pencereleri kıt olmaktan çıktı. 1M token bağlam, tüm kod tabanını, tüm DOM’u, tüm dokümantasyonu yükleyebilmen ve önceden parçalamak yerine modelin yeniden okumasına izin verebilmen demek.
  3. Modeller toparlanmayı öğrendi. Bir çağrı başarısız olduğunda, modern bir LLM aracı düzenler, yeni bir helper yazar ya da yaklaşım değiştirir. Framework yazarları bu toparlanma mantığını elle yazardı. Model bunu daha iyi yapıyor.

Bu üç şey bir kez doğru hale geldiğinde, LLM ile ham araç arasındaki her soyutlama katmanı bir yüktür. Bu, senin koruduğun, modelin etrafından dolaşmak zorunda kaldığı, görev örüntüden biraz saptığında kırılan koddur.

Greg’in cümlesi göstergedir: “Çalışmayan bir görev bulma konusunda herkesi meydan okuyorum”. Framework’lerin bilinen başarısızlık modları vardır. Harness’ların yoktur — ya da daha doğrusu, başarısızlık modu LLM’in kendisidir ve o gelişmeye devam ediyor.

2026’da harness yığını

Gözlerini kısarsan, yığının oluştuğunu görürsün:

  • Coding harness: Claude Code, Codex, Cursor agent modu
  • Browser harness: Browser Harness (Browser Use)
  • Research harness: Karpathy’nin autoresearch’ü — program.md + Claude Code
  • Data harness: gelişiyor — doğrudan DB erişimi + shell

Ortak form: LLM + ham araç + kalıcı çalışma dizini. Çalışma dizini, bağlamın biriktiği, helper’ların yazıldığı, modelin belleğinin turlar arasında yaşadığı yer.

Harness’lar bağlam üzerinde çalışır

Bu araçlarla inşa ediyorsan önemli olan kısım şu: bir harness, ona verdiğin bağlam kadar iyidir.

CLAUDE.md olmadan Claude Code, genel bir kod asistanıdır. İyi küratörlenmiş bir CLAUDE.md, bir referans doküman kitaplığı ve grep’leyebileceği bir bilgi klasörüne sahip Claude Code — Karpathy’nin kullandığı şey bu. 10x versiyonu bu.

Browser Harness için de aynı. Anlık olarak düzenlediği helpers.py bir yerden başlar. O yeri örüntülerle, auth akışlarıyla, belgelediğin siteye özel tuhaflıklarla ekersen — harness’ın kaldıracı olur. Ona boş bir dosya verirsen, her şeyi yeniden keşfetmek zorunda kalır.

İşi harness yapar. Avantajın, bağlam kitaplığında yaşar.

Save nereye oturuyor

Konuştuğumuz her harness diskten Markdown okur. CLAUDE.md, AGENTS.md, referans dokümanlar, kaydedilmiş dokümantasyon sayfaları, API notları — hepsi Markdown, hepsi agent’ın görebileceği bir klasörde.

Save, herhangi bir web sayfasını tek tıkla temiz Markdown’a dönüştüren bir araçtır. Dokümantasyon sayfaları, blog yazıları, Stack Overflow cevapları, GitHub README’leri, API referansları — çalıştıracağın bir sonraki harness’ın okuması gereken her ne varsa.

2026’da Claude Code ve Browser Harness’tan en çoğunu çıkaranlar daha fazla framework inşa etmiyor. Daha iyi kitaplıklar küratörlüyor. Harness bedava. Moat, bağlam.


Save, herhangi bir web sayfasını AI harness’ının okuyabileceği Markdown’a dönüştürür — uzantıyı yükle ve agent’larını daha akıllı kılacak kitaplığı inşa etmeye başla.