不是框架,是 Harness —— AI 工具的新形態
2026 年 4 月 18 日,Browser Use 共同創辦人 Gregor Zunic 發了這則推文:
Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.
沒有框架。直連 CDP。一條通往 Chrome 的 WebSocket。一個 agent 即時編輯的 helpers.py。為 Claude Code 和 Codex 提供 drop-in。推文在這裡。
這不只是一個瀏覽器自動化工具。它是至今為止對一個悄悄接管 2026 年 AI 工具鏈的模式,最清晰的表述:harness。
什麼是 harness?
Harness 是圍繞 LLM 的最小封裝,讓它能做有用的工作。它暴露一個工具表面——通常是檔案系統、shell,有時是 HTTP——然後讓路。
比較兩種形態:
| 框架(Framework) | Harness |
|---|---|
| 定義工作流、步驟、DAG | 沒有工作流。LLM 決定。 |
| 把底層工具抽象掉 | 暴露原始工具(shell、CDP、fs) |
| 規定 agent 應該做什麼 | 規定 agent 可以做什麼 |
| 任務不合模板就崩潰 | 彎曲,因為根本沒有模板 |
| 為笨模型最佳化 | 為聰明模型最佳化 |
2023 年,框架合理。模型沒有可靠到能把原始能力交給它,所以要搭護欄。LangChain、AutoGPT、CrewAI——都是「讓我牽著這個 LLM 走一條流水線」的變體。
模型變聰明了。護欄開始入不敷出。
Claude Code 是第一個真正的 harness
Claude Code 在 2025 年初以激進的設計登場:沒有編排、沒有 planner 模組、沒有記憶圖。只有一個 LLM,配上 Bash、Read、Edit、Write、Grep 和幾個 Web 工具。就這些。
賭注是:一個夠聰明的模型,給它檔案系統存取和 shell,就能自己完成編排。結果它能。Karpathy 稱它是「我真正每天都在用的唯一一個 AI 工具」。
幾個月後,Codex 落地在同樣的形態上。模型不同,哲學相同:給 LLM 一個沙盒和工具,不是框架。
Browser Harness 就是這個模式來到瀏覽器自動化領域。不是 Selenium 那套步驟定義,也不是用 agent scaffolding 包起來的 Playwright 風格 API,而是一條原始的 Chrome DevTools Protocol 連線,和一個 agent 出問題時自己改寫的 helpers 檔。
這就是「self-healing」。沒有重試邏輯、沒有 fallback 策略、沒有錯誤狀態解析器。LLM 讀錯誤、改 helper、再試一次。程式碼庫就是記憶。
為什麼 harness 會贏
三件事同時發生了位移:
- 工具使用變可靠了。 Claude 4 和 GPT-5 對工具 schema 的遵循足夠一致,你不再需要一個專門抓取格式錯亂呼叫的驗證層。
- 上下文視窗不再稀缺。 1M token 上下文意味著你可以把整個程式碼庫、整個 DOM、整套文件全部裝進去——讓模型反覆讀,而不是預先切片。
- 模型學會了復原。 呼叫失敗時,現代 LLM 會改工具、寫新的 helper,或者換個路子。框架作者以前是手寫這套復原邏輯的。模型做得更好。
一旦這三件事為真,LLM 和原始工具之間的每一層抽象都成了負擔。那是你要維護的程式碼,模型要繞開的程式碼,任務一旦稍微偏離模式就崩的程式碼。
Greg 那句話就是訊號:「我挑戰誰能找出一個無法完成的任務」。框架有已知的失敗模式。Harness 沒有——或者說,它們的失敗模式就是 LLM 本身,而 LLM 還在持續變好。
2026 年的 harness 堆疊
稍微瞇眼,就能看到堆疊在成形:
- Coding harness:Claude Code、Codex、Cursor 的 agent 模式
- Browser harness:Browser Harness(Browser Use)
- Research harness:Karpathy 的 autoresearch——
program.md+ Claude Code - Data harness:正在冒頭——直連資料庫 + shell
共同形態:LLM + 原始工具 + 持久工作目錄。工作目錄是上下文累積的地方、helper 被寫下的地方、模型在回合之間的記憶所在之處。
Harness 跑在上下文之上
如果你正在用這些工具搭東西,真正重要的部分是這個:一個 harness 有多好,取決於你餵給它的上下文有多好。
沒有 CLAUDE.md 的 Claude Code 是一個通用程式助手。有一份精心維護的 CLAUDE.md、一個參考文件庫、一個它能 grep 的知識資料夾的 Claude Code——那就是 Karpathy 用的版本。那是 10x 版本。
Browser Harness 也一樣。它即時編輯的那個 helpers.py 要從某個起點開始。如果你把那個起點播種上你記錄過的模式、驗證流程、網站特定的怪癖——harness 就有了槓桿。給它一個空檔案,它就得把一切重新發現一遍。
做事的是 harness。你的優勢住在你的上下文庫裡。
Save 的位置
我們聊到的每一個 harness 都從磁碟讀 Markdown。CLAUDE.md、AGENTS.md、參考文件、儲存的文件頁、API 筆記——全是 Markdown,全放在 agent 能看到的資料夾裡。
Save 是一個一鍵把任何網頁轉成乾淨 Markdown 的工具。文件頁、部落格文章、Stack Overflow 回答、GitHub README、API 參考——你下一個要跑的 harness 需要讀的任何東西。
2026 年從 Claude Code 和 Browser Harness 榨出最多價值的人,不是在搭更多的框架,而是在整理更好的庫。Harness 是免費的。上下文才是護城河。
Save 把任何網頁變成你的 AI harness 可以讀的 Markdown——安裝擴充功能,開始搭建讓你的 agent 更聰明的那個庫。