Harness, bukan framework — bentuk baru tool AI
Pada 18 April 2026, Gregor Zunic — co-founder Browser Use — memposting ini:
Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.
Tanpa framework. CDP langsung. Satu websocket ke Chrome. Sebuah helpers.py yang di-edit agent secara langsung. Drop-in untuk Claude Code dan Codex. Tweet-nya di sini.
Ini bukan sekadar tool automasi browser. Ini pernyataan paling jelas sejauh ini dari sebuah pola yang diam-diam mengambil alih tooling AI di 2026: harness.
Apa itu harness?
Harness adalah pembungkus minimal di sekitar LLM yang memungkinkannya melakukan kerja yang berguna. Ia mengekspos permukaan tool — biasanya filesystem, shell, kadang HTTP — lalu menyingkir dari jalan.
Bandingkan kedua bentuknya:
| Framework | Harness |
|---|---|
| Mendefinisikan workflow, langkah, DAG | Tanpa workflow. LLM yang putuskan. |
| Mengabstraksi tool di lapisan bawah | Mengekspos tool mentah (shell, CDP, fs) |
| Menetapkan apa yang harus dilakukan agent | Menetapkan apa yang bisa dilakukan agent |
| Patah saat tugas tidak cocok dengan template | Melentur, karena tidak ada template |
| Dioptimalkan untuk model bodoh | Dioptimalkan untuk model pintar |
Framework masuk akal di 2023. Model belum cukup andal untuk dipercayai kemampuan mentah, jadi orang bangun pagar pembatas. LangChain, AutoGPT, CrewAI — semuanya variasi dari “biar saya gandeng tangan LLM ini lewati pipeline”.
Model jadi lebih pintar. Pagar pembatas mulai lebih memakan biaya daripada penghematannya.
Claude Code adalah harness sejati pertama
Claude Code dirilis awal 2025 dengan desain radikal: tanpa orkestrasi, tanpa modul planner, tanpa graph memori. Hanya LLM dengan Bash, Read, Edit, Write, Grep, dan beberapa tool web. Itu saja.
Taruhannya: model yang cukup pintar, diberi akses filesystem dan shell, bisa melakukan orkestrasi sendiri. Dan memang bisa. Karpathy menyebutnya “satu-satunya tool AI yang benar-benar saya pakai setiap hari”.
Codex mendarat di bentuk yang sama beberapa bulan kemudian. Model beda, filosofi sama: beri LLM sandbox dan tool, bukan framework.
Browser Harness adalah pola ini yang tiba di automasi browser. Alih-alih definisi langkah ala Selenium atau API ala Playwright yang dibungkus scaffolding agent, kamu dapat koneksi Chrome DevTools Protocol mentah dan sebuah file helpers yang di-rewrite agent saat sesuatu rusak.
Itulah bagian “self-healing”. Tidak ada logika retry, tidak ada strategi fallback, tidak ada parser state error. LLM membaca error, mengedit helper, mencoba lagi. Codebase adalah memorinya.
Kenapa harness menang
Tiga hal bergeser paralel:
- Penggunaan tool jadi andal. Claude 4 dan GPT-5 mengikuti skema tool cukup konsisten sehingga kamu tidak butuh lapisan validator yang menangkap panggilan cacat.
- Jendela konteks tak lagi langka. Konteks 1M token berarti kamu bisa muat seluruh codebase, seluruh DOM, seluruh docs — dan biarkan model membaca ulang alih-alih memotong di depan.
- Model belajar memulihkan diri. Saat panggilan gagal, LLM modern mengedit tool-nya, menulis helper baru, atau mengubah pendekatan. Penulis framework dulu menulis logika pemulihan itu dengan tangan. Model melakukannya lebih baik.
Begitu ketiga hal itu benar, setiap lapisan abstraksi antara LLM dan tool mentah menjadi beban. Itu kode yang kamu rawat, yang model harus akali, yang patah saat tugas sedikit menyimpang dari pola.
Kalimat Greg adalah tandanya: “Saya tantang siapa pun menemukan tugas yang TIDAK bekerja”. Framework punya mode kegagalan yang sudah dikenal. Harness tidak — atau tepatnya, mode kegagalannya adalah LLM itu sendiri, dan LLM terus makin baik.
Tumpukan harness di 2026
Kalau kamu menyipitkan mata, tumpukan itu terlihat mulai terbentuk:
- Coding harness: Claude Code, Codex, Cursor mode agent
- Browser harness: Browser Harness (Browser Use)
- Research harness: autoresearch-nya Karpathy —
program.md+ Claude Code - Data harness: sedang bermunculan — akses DB langsung + shell
Bentuk umum: LLM + tool mentah + direktori kerja persisten. Direktori kerja itu tempat konteks menumpuk, tempat helper ditulis, tempat memori model hidup di antara giliran.
Harness jalan di atas konteks
Inilah bagian yang penting kalau kamu sedang membangun dengan tool-tool ini: sebuah harness hanya sebagus konteks yang kamu berikan.
Claude Code tanpa CLAUDE.md adalah asisten coding generik. Claude Code dengan CLAUDE.md yang dikurasi baik, pustaka dokumen referensi, dan folder pengetahuan yang bisa dia grep — itulah yang Karpathy pakai. Itu versi 10x-nya.
Sama untuk Browser Harness. helpers.py yang dia edit langsung itu bermula dari suatu tempat. Kalau kamu menyemai tempat itu dengan pola, alur auth, keanehan spesifik situs yang sudah kamu dokumentasikan — harness punya pengungkit. Kalau kamu beri file kosong, dia harus menemukan ulang semuanya.
Yang melakukan pekerjaan adalah harness. Keunggulanmu tinggal di pustaka konteks.
Di mana Save masuk
Setiap harness yang kita bicarakan membaca Markdown dari disk. CLAUDE.md, AGENTS.md, dokumen referensi, halaman dokumentasi yang tersimpan, catatan API — semua Markdown, semua ada di folder yang bisa dilihat agent.
Save adalah konverter sekali-klik dari halaman web apa pun ke Markdown bersih. Halaman dokumentasi, postingan blog, jawaban Stack Overflow, README GitHub, referensi API — apa pun yang perlu dibaca harness berikutnya yang kamu jalankan.
Orang-orang yang mendapatkan hasil maksimal dari Claude Code dan Browser Harness di 2026 bukan sedang membangun lebih banyak framework. Mereka mengkurasi pustaka yang lebih baik. Harness itu gratis. Konteks adalah parit pertahanannya.
Save mengubah halaman web apa pun menjadi Markdown yang bisa dibaca harness AI-mu — pasang ekstensinya dan mulai membangun pustaka yang akan membuat agent-mu lebih pintar.