返回博客

不是框架,是 Harness —— AI 工具的新形态

· Save Team
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

2026 年 4 月 18 日,Browser Use 联合创始人 Gregor Zunic 发了这条推:

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

没有框架。直连 CDP。一条通往 Chrome 的 WebSocket。一个 agent 实时编辑的 helpers.py。为 Claude Code 和 Codex 提供 drop-in。推文在这里

这不只是一个浏览器自动化工具。它是迄今为止对一个悄悄接管 2026 年 AI 工具链模式的最清晰表述:harness

什么是 harness?

Harness 是围绕 LLM 的最小封装,让它能做有用的工作。它暴露一个工具表面——通常是文件系统、shell,有时是 HTTP——然后让路。

对比两种形态:

框架(Framework)Harness
定义工作流、步骤、DAG没有工作流。LLM 决定。
把底层工具抽象掉暴露原始工具(shell、CDP、fs)
规定 agent 应该做什么规定 agent 可以做什么
任务不合模板就崩溃弯曲,因为根本没有模板
为笨模型优化为聪明模型优化

2023 年,框架是合理的。模型没有可靠到能把原始能力交给它,所以要搭护栏。LangChain、AutoGPT、CrewAI——都是”让我牵着这个 LLM 走一条流水线”的变体。

模型变聪明了。护栏开始入不敷出。

Claude Code 是第一个真正的 harness

Claude Code 在 2025 年初以激进的设计出场:没有编排、没有 planner 模块、没有记忆图。只有一个 LLM,配上 Bash、Read、Edit、Write、Grep 和几个 Web 工具。就这些。

押注是:一个足够聪明的模型,给它文件系统访问和 shell,就能自己完成编排。结果它能。Karpathy 称它是”我真正每天都在用的唯一一个 AI 工具”。

几个月后,Codex 落地在同样的形态上。模型不同,哲学相同:给 LLM 一个沙盒和工具,不是框架。

Browser Harness 就是这个模式来到浏览器自动化领域。不是 Selenium 那套步骤定义,也不是用 agent scaffolding 包起来的 Playwright 风格 API,而是一条原始的 Chrome DevTools Protocol 连接,和一个 agent 出问题时自己改写的 helpers 文件。

这就是”self-healing”。没有重试逻辑、没有 fallback 策略、没有错误状态解析器。LLM 读错误、改 helper、再试一次。代码库就是记忆。

为什么 harness 会赢

三件事并行地发生了位移:

  1. 工具使用变可靠了。 Claude 4 和 GPT-5 对工具 schema 的遵循足够一致,你不再需要一个专门捕捉格式错乱调用的验证层。
  2. 上下文窗口不再稀缺。 1M token 上下文意味着你可以把整个代码库、整个 DOM、整套文档全部装进去——让模型反复读,而不是预先切片。
  3. 模型学会了恢复。 调用失败时,现代 LLM 会改工具、写新的 helper,或者换个路子。框架作者以前是手写这套恢复逻辑的。模型做得更好。

一旦这三件事为真,LLM 和原始工具之间的每一层抽象都成了负担。那是要维护的代码,模型要绕开的代码,任务一旦偏离模式一点点就崩的代码。

Greg 的那句话就是信号:“我挑战谁能找出一个无法完成的任务”。框架有已知的失败模式。Harness 没有——或者说,它们的失败模式就是 LLM 本身,而 LLM 还在持续变好。

2026 年的 harness 栈

稍微眯眼,就能看到栈在成形:

  • Coding harness:Claude Code、Codex、Cursor 的 agent 模式
  • Browser harness:Browser Harness(Browser Use)
  • Research harness:Karpathy 的 autoresearch——program.md + Claude Code
  • Data harness:正在冒头——直连数据库 + shell

共同形态:LLM + 原始工具 + 持久工作目录。工作目录是上下文累积的地方、helper 被写下的地方、模型在回合之间的记忆所在之处。

Harness 跑在上下文之上

如果你正在拿这些工具搭东西,真正重要的部分是这个:一个 harness 有多好,取决于你喂给它的上下文有多好。

没有 CLAUDE.md 的 Claude Code 是一个通用代码助手。有一份精心维护的 CLAUDE.md、一个参考文档库、一个它能 grep 的知识文件夹的 Claude Code——那就是 Karpathy 用的版本。那是 10x 版本。

Browser Harness 也一样。它实时编辑的那个 helpers.py 要从某个起点开始。如果你把那个起点播种上你记录过的模式、认证流程、站点特定的怪癖——harness 就有了杠杆。给它一个空文件,它就得把一切重新发现一遍。

干活的是 harness。你的优势住在你的上下文库里。

Save 的位置

我们聊到的每一个 harness 都从磁盘读 Markdown。CLAUDE.mdAGENTS.md、参考文档、保存的文档页、API 笔记——全是 Markdown,全放在 agent 能看到的文件夹里。

Save 是一个一键把任何网页转成干净 Markdown 的工具。文档页、博客文章、Stack Overflow 回答、GitHub README、API 参考——你下一个要跑的 harness 需要读的任何东西。

2026 年从 Claude Code 和 Browser Harness 榨出最多价值的人,不是在搭更多的框架,而是在整理更好的库。Harness 是免费的。上下文才是护城河。


Save 把任何网页变成你的 AI harness 可以读的 Markdown——安装扩展,开始搭建让你的 agent 更聪明的那个库。