Harness, không phải framework — hình dạng mới của công cụ AI
Ngày 18 tháng 4 năm 2026, Gregor Zunic — đồng sáng lập Browser Use — đăng dòng này:
Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.
Không framework. CDP trực tiếp. Một websocket tới Chrome. Một helpers.py mà agent chỉnh sửa ngay lập tức. Drop-in cho Claude Code và Codex. Tweet ở đây.
Đây không chỉ là một công cụ tự động hoá trình duyệt. Đây là phát biểu rõ ràng nhất cho đến nay về một mẫu đang âm thầm tiếp quản tooling AI trong năm 2026: harness.
Harness là gì?
Harness là lớp bọc tối thiểu quanh một LLM cho phép nó làm việc hữu ích. Nó phơi bày một bề mặt công cụ — thường là hệ thống tệp, shell, đôi khi HTTP — rồi tránh đường.
So sánh hai hình dạng:
| Framework | Harness |
|---|---|
| Định nghĩa workflow, bước, DAG | Không workflow. LLM quyết định. |
| Trừu tượng hoá các công cụ nền | Phơi bày công cụ thô (shell, CDP, fs) |
| Quy định agent nên làm gì | Quy định agent có thể làm gì |
| Gãy khi tác vụ không khớp template | Uốn theo, vì không có template |
| Tối ưu cho mô hình ngu | Tối ưu cho mô hình thông minh |
Framework có lý vào năm 2023. Mô hình chưa đủ đáng tin để giao cho năng lực thô, nên ta dựng lan can. LangChain, AutoGPT, CrewAI — tất cả là biến thể của “để tôi dắt tay cái LLM này qua một pipeline”.
Mô hình trở nên thông minh hơn. Lan can bắt đầu tốn hơn là tiết kiệm.
Claude Code là harness thực thụ đầu tiên
Claude Code ra mắt đầu năm 2025 với thiết kế cấp tiến: không orchestration, không mô-đun planner, không đồ thị bộ nhớ. Chỉ là một LLM với Bash, Read, Edit, Write, Grep và vài công cụ web. Vậy thôi.
Cược là: một mô hình đủ thông minh, được cho quyền truy cập hệ thống tệp và một shell, có thể tự lo orchestration. Và nó làm được. Karpathy gọi đó là “công cụ AI duy nhất tôi thật sự dùng mỗi ngày”.
Codex đáp xuống cùng hình dạng vài tháng sau. Mô hình khác, triết lý y hệt: cho LLM một sandbox và công cụ, không phải framework.
Browser Harness là mẫu này đến với tự động hoá trình duyệt. Thay vì định nghĩa bước kiểu Selenium hay API kiểu Playwright bọc trong scaffolding agent, bạn có một kết nối Chrome DevTools Protocol thô và một tệp helpers mà agent viết lại khi có gì đó hỏng.
Đó là phần “self-healing”. Không có logic retry, không chiến lược fallback, không parser trạng thái lỗi. LLM đọc lỗi, chỉnh helper, thử lại. Codebase chính là bộ nhớ.
Vì sao harness đang thắng
Ba thứ dịch chuyển song song:
- Việc dùng công cụ trở nên đáng tin. Claude 4 và GPT-5 tuân thủ schema công cụ nhất quán đủ để không cần một lớp validator để bắt các cuộc gọi méo mó.
- Cửa sổ ngữ cảnh không còn khan hiếm. Ngữ cảnh 1M token nghĩa là bạn có thể nạp cả codebase, cả DOM, cả tập tài liệu — rồi để mô hình đọc lại thay vì chunk trước.
- Mô hình học được cách hồi phục. Khi một cuộc gọi thất bại, LLM hiện đại chỉnh công cụ, viết helper mới, hoặc đổi cách tiếp cận. Tác giả framework trước đây viết tay logic hồi phục đó. Mô hình làm tốt hơn.
Một khi ba điều đó đúng, mọi lớp trừu tượng giữa LLM và công cụ thô đều là một gánh nặng. Đó là mã bạn phải bảo trì, mà mô hình phải né tránh, và gãy khi tác vụ lệch mẫu chỉ một chút.
Câu của Greg là dấu hiệu: “Tôi thách bất kỳ ai tìm ra một tác vụ KHÔNG hoạt động”. Framework có các chế độ thất bại đã biết. Harness thì không — hay đúng hơn, chế độ thất bại của nó là chính LLM, và LLM tiếp tục giỏi lên.
Ngăn xếp harness năm 2026
Nhíu mắt một chút, bạn thấy ngăn xếp đang hình thành:
- Coding harness: Claude Code, Codex, chế độ agent của Cursor
- Browser harness: Browser Harness (Browser Use)
- Research harness: autoresearch của Karpathy —
program.md+ Claude Code - Data harness: đang nổi lên — truy cập DB trực tiếp + shell
Hình dạng chung: LLM + công cụ thô + thư mục làm việc bền vững. Thư mục làm việc là nơi ngữ cảnh tích tụ, nơi helper được viết, nơi bộ nhớ của mô hình sống giữa các lượt.
Harness chạy trên ngữ cảnh
Đây là phần quan trọng nếu bạn đang xây dựng với các công cụ này: một harness chỉ tốt bằng ngữ cảnh bạn trao cho nó.
Claude Code không có CLAUDE.md là một trợ lý code chung chung. Claude Code với một CLAUDE.md được chăm chút kỹ, một thư viện tài liệu tham khảo và một thư mục kiến thức có thể grep — đó là thứ Karpathy dùng. Đó là phiên bản 10x.
Tương tự cho Browser Harness. helpers.py mà nó chỉnh ngay tại chỗ bắt đầu từ đâu đó. Nếu bạn gieo mầm nơi đó với mẫu, auth flow, đặc thù site mà bạn đã ghi lại — harness có đòn bẩy. Nếu đưa cho nó một tệp rỗng, nó phải khám phá lại mọi thứ.
Harness làm công việc. Lợi thế của bạn nằm ở thư viện ngữ cảnh.
Save khớp vào đâu
Mọi harness chúng ta vừa nói đều đọc Markdown từ đĩa. CLAUDE.md, AGENTS.md, tài liệu tham khảo, trang tài liệu đã lưu, ghi chú API — tất cả là Markdown, tất cả nằm trong thư mục mà agent có thể thấy.
Save là bộ chuyển đổi một-cú-nhấp từ bất kỳ trang web nào sang Markdown sạch. Trang tài liệu, bài blog, câu trả lời Stack Overflow, README trên GitHub, tài liệu tham chiếu API — bất cứ thứ gì harness tiếp theo của bạn cần đọc.
Những người tận dụng Claude Code và Browser Harness nhiều nhất trong năm 2026 không xây thêm framework. Họ đang chăm sóc thư viện tốt hơn. Harness thì miễn phí. Ngữ cảnh mới là hào.
Save biến bất kỳ trang web nào thành Markdown mà harness AI của bạn có thể đọc — cài extension và bắt đầu xây thư viện sẽ làm các agent của bạn thông minh hơn.