Harnesses, ikke frameworks — den nye form for AI-værktøjer
Den 18. april 2026 skrev Gregor Zunic — medstifter af Browser Use — dette:
Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.
Intet framework. Direkte CDP. Én websocket til Chrome. En helpers.py, som agenten redigerer on the fly. Drop-in til Claude Code og Codex. Tweetet er her.
Dette er ikke bare et browser-automatiseringsværktøj. Det er den klareste formulering hidtil af et mønster, der i 2026 stille og roligt overtager AI-tooling: harnessen.
Hvad er en harness?
En harness er den mindst mulige indpakning rundt om en LLM, som lader den udføre nyttigt arbejde. Den eksponerer en værktøjsflade — typisk filsystem, shell, måske HTTP — og går så af vejen.
Sammenlign de to former:
| Framework | Harness |
|---|---|
| Definerer workflows, trin, DAG’er | Intet workflow. LLM’en bestemmer. |
| Abstraherer de underliggende værktøjer væk | Eksponerer rå værktøjer (shell, CDP, fs) |
| Foreskriver hvad agenten skal gøre | Foreskriver hvad agenten kan gøre |
| Brækker når opgaven ikke passer i template’et | Bøjer sig, fordi der ikke er noget template |
| Optimeret til dumme modeller | Optimeret til kloge modeller |
Frameworks gav mening i 2023. Modellerne var ikke pålidelige nok til at man kunne stole på dem med rå kapacitet, så man byggede rækværker. LangChain, AutoGPT, CrewAI — alle sammen variationer over “lad mig holde denne LLM i hånden gennem en pipeline”.
Modellerne blev klogere. Rækværkerne begyndte at koste mere, end de sparede.
Claude Code var den første rigtige harness
Claude Code udkom i starten af 2025 med et radikalt design: ingen orkestrering, intet planner-modul, ingen hukommelses-graf. Bare en LLM med Bash, Read, Edit, Write, Grep og et par web-værktøjer. Det var det.
Væddemålet var, at en model, der var klog nok, givet filsystem-adgang og en shell, kunne klare orkestreringen selv. Og det kunne den. Karpathy kaldte det “det eneste AI-værktøj, jeg faktisk bruger hver dag”.
Codex landede på samme form få måneder senere. Anden model, samme filosofi: giv LLM’en en sandkasse og værktøjer, ikke et framework.
Browser Harness er dette mønster, der nu er ankommet til browser-automatisering. I stedet for Selenium-agtige trindefinitioner eller Playwright-lignende API’er pakket ind i agent-scaffolding, får du en rå Chrome DevTools Protocol-forbindelse og en helpers-fil, som agenten omskriver, når noget brækker.
Det er “self-healing”-delen. Ingen retry-logik, ingen fallback-strategi, ingen parser for fejltilstande. LLM’en læser fejlen, redigerer helperen, prøver igen. Kodebasen er hukommelsen.
Hvorfor harnesses vinder
Tre ting rykkede parallelt:
- Værktøjsbrug blev pålidelig. Claude 4 og GPT-5 følger værktøjsskemaer konsekvent nok til, at man ikke behøver et validator-lag, der fanger forkerte kald.
- Kontekstvinduer holdt op med at være en mangelvare. Kontekst på 1M tokens betyder, at man kan indlæse hele kodebasen, hele DOM’en, hele doc-sættet — og lade modellen genlæse i stedet for at prædele.
- Modellerne lærte at komme sig. Når et kald fejler, redigerer en moderne LLM værktøjet, skriver en ny helper eller ændrer tilgang. Framework-forfattere skrev den recovery-logik i hånden. Modellen gør det bedre.
Når først de tre ting er sande, er hvert abstraktionslag mellem LLM og rå værktøj en belastning. Det er kode, som du vedligeholder, som modellen skal gå uden om, som brækker, når opgaven afviger bare lidt fra mønsteret.
Gregs linje er tegnet: “Jeg udfordrer nogen til at finde en opgave, der IKKE virker”. Frameworks har kendte fejltilstande. Harnesses gør ikke — eller rettere, deres fejltilstand er LLM’en selv, og den bliver ved med at blive bedre.
Harness-stakken i 2026
Hvis du kniber øjnene sammen, kan du se stakken tage form:
- Coding harness: Claude Code, Codex, Cursor agent-tilstand
- Browser harness: Browser Harness (Browser Use)
- Research harness: Karpathys autoresearch —
program.md+ Claude Code - Data harness: på vej — direkte DB-adgang + shell
Den fælles form: LLM + rå værktøj + vedvarende arbejdsmappe. Arbejdsmappen er, hvor kontekst hober sig op, hvor helpers bliver skrevet, hvor modellens hukommelse lever mellem tur og tur.
Harnesses kører på kontekst
Her er den del, der betyder noget, hvis du bygger med disse værktøjer: en harness er kun så god som den kontekst, du giver den.
Claude Code uden CLAUDE.md er en generisk kode-assistent. Claude Code med en velplejet CLAUDE.md, et bibliotek af referencedokumenter og en videnmappe, den kan grep’e — det er, hvad Karpathy bruger. Det er 10x-versionen.
Samme for Browser Harness. Den helpers.py, den redigerer on the fly, starter et sted. Hvis du sår det sted med mønstre, auth-flows og site-specifikke særheder, du har dokumenteret — har harnessen løftestang. Giver du den en tom fil, må den genopdage alt.
Harnessen udfører arbejdet. Dit kontekstbibliotek er, hvor din fordel bor.
Hvor Save passer ind
Hver eneste harness, vi har talt om, læser Markdown fra disk. CLAUDE.md, AGENTS.md, referencedokumenter, gemte dokumentationssider, API-noter — alt sammen Markdown, alt sammen i en mappe, agenten kan se.
Save er en ét-klik-konverter fra enhver webside til ren Markdown. Dokumentationssider, blogposts, Stack Overflow-svar, GitHub READMEs, API-referencer — hvad end den næste harness, du kører, får brug for at læse.
De folk, der får mest ud af Claude Code og Browser Harness i 2026, bygger ikke mere framework. De kuraterer bedre biblioteker. Harnessen er gratis. Konteksten er voldgraven.
Save gør enhver webside til Markdown, som din AI-harness kan læse — installer udvidelsen og begynd at bygge det bibliotek, der gør dine agenter klogere.