Tilbake til bloggen

Harnesses, ikke rammeverk — den nye formen for AI-verktøy

· Save Team
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

Den 18. april 2026 skrev Gregor Zunic — medgrunnlegger av Browser Use — dette:

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

Ikke noe rammeverk. Direkte CDP. Én websocket til Chrome. En helpers.py som agenten redigerer underveis. Drop-in for Claude Code og Codex. Tweeten er her.

Dette er ikke bare et verktøy for nettleserautomasjon. Det er den klareste formuleringen så langt av et mønster som stille og rolig overtar AI-verktøy i 2026: harnessen.

Hva er en harness?

En harness er den minimale innpakningen rundt en LLM som lar den gjøre nyttig arbeid. Den eksponerer en verktøyoverflate — vanligvis filsystem, shell, kanskje HTTP — og går deretter av veien.

Sammenlign de to formene:

RammeverkHarness
Definerer workflows, steg, DAG-erIngen workflow. LLM-en bestemmer.
Abstraherer bort de underliggende verktøyeneEksponerer rå verktøy (shell, CDP, fs)
Foreskriver hva agenten skal gjøreForeskriver hva agenten kan gjøre
Bryter når oppgaven ikke passer i malenBøyer seg, for det er ingen mal
Optimert for dumme modellerOptimert for smarte modeller

Rammeverk ga mening i 2023. Modellene var ikke pålitelige nok til at man kunne betro dem rå kapasitet, så man bygde rekkverk. LangChain, AutoGPT, CrewAI — alle variasjoner av “la meg holde denne LLM-en i hånden gjennom en pipeline”.

Modellene ble smartere. Rekkverkene begynte å koste mer enn de sparte.

Claude Code var den første ekte harnessen

Claude Code kom i begynnelsen av 2025 med en radikal design: ingen orkestrering, ingen planner-modul, ingen minne-graf. Bare en LLM med Bash, Read, Edit, Write, Grep og et par web-verktøy. Det var det.

Veddemålet var at en modell smart nok, gitt filsystemtilgang og en shell, kunne håndtere orkestreringen selv. Og det kunne den. Karpathy kalte det “det eneste AI-verktøyet jeg faktisk bruker hver dag”.

Codex landet på samme form noen måneder senere. Annen modell, samme filosofi: gi LLM-en en sandkasse og verktøy, ikke et rammeverk.

Browser Harness er dette mønsteret som ankommer nettleserautomasjonen. I stedet for Selenium-aktige steg-definisjoner eller Playwright-lignende API-er pakket inn i agent-scaffolding, får du en rå Chrome DevTools Protocol-tilkobling og en helpers-fil som agenten skriver om når noe ryker.

Det er “self-healing”-delen. Ingen retry-logikk, ingen fallback-strategi, ingen parser for feiltilstander. LLM-en leser feilen, redigerer helperen, prøver igjen. Kodebasen er minnet.

Hvorfor harnesses vinner

Tre ting skiftet parallelt:

  1. Verktøybruk ble pålitelig. Claude 4 og GPT-5 følger verktøyskjemaer konsekvent nok til at du ikke trenger et validator-lag som fanger opp misformede kall.
  2. Kontekstvinduer sluttet å være knappe. En kontekst på 1M tokens betyr at du kan laste hele kodebasen, hele DOM-en, hele docs — og la modellen lese om igjen i stedet for å chunke på forhånd.
  3. Modellene lærte å komme seg. Når et kall feiler, redigerer en moderne LLM verktøyet, skriver en ny helper, eller endrer tilnærming. Rammeverk-forfattere skrev den gjenopprettingslogikken for hånd. Modellen gjør det bedre.

Så snart de tre tingene er sanne, blir hvert abstraksjonslag mellom LLM og rått verktøy en belastning. Det er kode du vedlikeholder, som modellen må gå rundt, som ryker når oppgaven avviker bare litt fra mønsteret.

Gregs linje er tegnet: “Jeg utfordrer hvem som helst til å finne en oppgave som IKKE fungerer”. Rammeverk har kjente feilmoduser. Harnesses har ikke — eller rettere sagt, deres feilmodus er LLM-en selv, og den fortsetter å bli bedre.

Harness-stacken i 2026

Hvis du myser, kan du se stacken ta form:

  • Coding harness: Claude Code, Codex, Cursor agent-modus
  • Browser harness: Browser Harness (Browser Use)
  • Research harness: Karpathys autoresearch — program.md + Claude Code
  • Data harness: i ferd med å vokse frem — direkte DB-tilgang + shell

Den felles formen: LLM + rått verktøy + vedvarende arbeidskatalog. Arbeidskatalogen er der kontekst samler seg, der helpers blir skrevet, der modellens minne lever mellom turer.

Harnesses kjører på kontekst

Her er delen som betyr noe hvis du bygger med disse verktøyene: en harness er bare så god som konteksten du gir den.

Claude Code uten en CLAUDE.md er en generisk kode-assistent. Claude Code med en velpleid CLAUDE.md, et bibliotek av referansedokumenter og en kunnskapsmappe den kan grep’e — det er det Karpathy bruker. Det er 10x-versjonen.

Det samme for Browser Harness. helpers.py den redigerer underveis starter et sted. Hvis du sår det stedet med mønstre, auth-flyter og side-spesifikke særegenheter du har dokumentert — har harnessen løftestang. Gir du den en tom fil, må den gjenoppdage alt.

Harnessen gjør jobben. Kontekstbiblioteket ditt er der fordelen din bor.

Hvor Save passer inn

Hver harness vi har snakket om leser Markdown fra disk. CLAUDE.md, AGENTS.md, referansedokumenter, lagrede dokumentasjonssider, API-notater — alt i Markdown, alt i en mappe agenten kan se.

Save er en ett-klikks konverterer fra hvilken som helst nettside til ren Markdown. Dokumentasjonssider, blogginnlegg, Stack Overflow-svar, GitHub READMEs, API-referanser — hva enn den neste harnessen du kjører trenger å lese.

De som får mest ut av Claude Code og Browser Harness i 2026 bygger ikke mer rammeverk. De kuraterer bedre biblioteker. Harnessen er gratis. Konteksten er vollgraven.


Save gjør en hvilken som helst nettside om til Markdown din AI-harness kan lese — installer utvidelsen og begynn å bygge biblioteket som gjør agentene dine smartere.