Tillbaka till bloggen

Harnesses, inte frameworks — den nya formen för AI-verktyg

· Save Team
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

Den 18 april 2026 skrev Gregor Zunic — medgrundare av Browser Use — detta:

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

Inget framework. Direkt CDP. En websocket till Chrome. En helpers.py som agenten redigerar on the fly. Drop-in för Claude Code och Codex. Tweeten finns här.

Det här är inte bara ett verktyg för browser-automation. Det är den klaraste formuleringen hittills av ett mönster som i tysthet tar över AI-tooling under 2026: harnessen.

Vad är en harness?

En harness är det minimala omslaget runt en LLM som låter den utföra nyttigt arbete. Den exponerar en verktygsyta — vanligen filsystem, shell, kanske HTTP — och går sedan ur vägen.

Jämför de två formerna:

FrameworkHarness
Definierar workflows, steg, DAG:erInget workflow. LLM:en bestämmer.
Abstraherar bort de underliggande verktygenExponerar råa verktyg (shell, CDP, fs)
Föreskriver vad agenten ska göraFöreskriver vad agenten kan göra
Bryts när uppgiften inte passar i mallenBöjer sig, för det finns ingen mall
Optimerad för dumma modellerOptimerad för smarta modeller

Frameworks var vettiga 2023. Modellerna var inte pålitliga nog att anförtros rå kapacitet, så man byggde räcken. LangChain, AutoGPT, CrewAI — alla varianter av “låt mig leda den här LLM:en i handen genom en pipeline”.

Modellerna blev smartare. Räckena började kosta mer än de sparade.

Claude Code var den första riktiga harnessen

Claude Code släpptes i början av 2025 med en radikal design: ingen orkestrering, ingen planner-modul, ingen minnesgraf. Bara en LLM med Bash, Read, Edit, Write, Grep och några webb-verktyg. Det var allt.

Satsningen var att en modell som var smart nog, given filsystemsåtkomst och en shell, kunde sköta orkestreringen själv. Och det kunde den. Karpathy kallade det “det enda AI-verktyg jag faktiskt använder varje dag”.

Codex landade i samma form några månader senare. Annan modell, samma filosofi: ge LLM:en en sandlåda och verktyg, inte ett framework.

Browser Harness är detta mönster som kommer in i browser-automationen. I stället för Selenium-aktiga stegdefinitioner eller Playwright-liknande API:er inlindade i agent-scaffolding får du en rå Chrome DevTools Protocol-anslutning och en helpers-fil som agenten skriver om när något går sönder.

Det är “self-healing”-delen. Ingen retry-logik, ingen fallback-strategi, ingen parser för feltillstånd. LLM:en läser felet, redigerar helpern, försöker igen. Kodbasen är minnet.

Varför harnesses vinner

Tre saker skiftade parallellt:

  1. Verktygsanvändning blev pålitlig. Claude 4 och GPT-5 följer verktygsschemana tillräckligt konsekvent för att man inte behöver ett valideringslager som fångar missbildade anrop.
  2. Kontextfönster slutade vara en bristvara. En kontext på 1M tokens betyder att du kan ladda hela kodbasen, hela DOM:en, hela docs — och låta modellen läsa om i stället för att förhandschunka.
  3. Modellerna lärde sig att återhämta sig. När ett anrop misslyckas redigerar en modern LLM verktyget, skriver en ny helper, eller byter angreppssätt. Framework-författarna skrev den återhämtningslogiken för hand. Modellen gör det bättre.

När de tre sakerna är sanna blir varje abstraktionslager mellan LLM och rått verktyg en skuld. Det är kod du underhåller, som modellen måste gå runt, som går sönder när uppgiften avviker lite från mönstret.

Gregs rad är skvallret: “Jag utmanar vem som helst att hitta en uppgift som INTE fungerar”. Frameworks har kända felmoder. Harnesses har inte — eller snarare, deras felmod är LLM:en själv, och den fortsätter bli bättre.

Harness-stacken 2026

Om du kisar ser du stacken ta form:

  • Coding harness: Claude Code, Codex, Cursor agent-läge
  • Browser harness: Browser Harness (Browser Use)
  • Research harness: Karpathys autoresearch — program.md + Claude Code
  • Data harness: under framväxt — direkt DB-åtkomst + shell

Den gemensamma formen: LLM + rått verktyg + beständig arbetskatalog. Arbetskatalogen är där kontext samlas, där helpers skrivs, där modellens minne lever mellan turerna.

Harnesses kör på kontext

Här är den del som betyder något om du bygger med de här verktygen: en harness är bara så bra som den kontext du ger den.

Claude Code utan en CLAUDE.md är en generisk kodassistent. Claude Code med en välskött CLAUDE.md, ett bibliotek av referensdokument och en kunskapsmapp den kan grep:a — det är vad Karpathy använder. Det är 10x-versionen.

Samma för Browser Harness. Den helpers.py som den redigerar on the fly startar någonstans. Om du sår det någonstans med mönster, auth-flöden, sajt-specifika egenheter du dokumenterat — har harnessen hävstång. Ger du den en tom fil måste den återupptäcka allt.

Harnessen gör jobbet. Ditt kontextbibliotek är där din fördel bor.

Var Save passar in

Varje harness vi pratat om läser Markdown från disk. CLAUDE.md, AGENTS.md, referensdokument, sparade dokumentationssidor, API-anteckningar — allt i Markdown, allt i en mapp agenten kan se.

Save är en ett-klicks-konverterare från vilken webbsida som helst till ren Markdown. Dokumentationssidor, bloggposter, Stack Overflow-svar, GitHub READMEs, API-referenser — vad den nästa harness du kör än behöver läsa.

De som får mest ut av Claude Code och Browser Harness 2026 bygger inte mer framework. De kurerar bättre bibliotek. Harnessen är gratis. Kontexten är vallgraven.


Save gör vilken webbsida som helst till Markdown som din AI-harness kan läsa — installera tillägget och börja bygga biblioteket som gör dina agenter smartare.