Назад к блогу

Харнессы, а не фреймворки — новая форма ИИ-инструментов

· Save Team
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

18 апреля 2026 года Грегор Зунич — сооснователь Browser Use — написал:

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

Никакого фреймворка. Прямой CDP. Один вебсокет к Chrome. helpers.py, который агент правит на лету. Drop-in для Claude Code и Codex. Твит здесь.

Это не просто инструмент автоматизации браузера. Это самая чёткая на сегодня формулировка паттерна, который тихо захватывает ИИ-тулинг в 2026 году: харнесс.

Что такое харнесс?

Харнесс — это минимальная обёртка вокруг LLM, позволяющая ему делать полезную работу. Она выставляет поверхность инструментов — обычно файловая система, shell, иногда HTTP — и уходит с дороги.

Сравни две формы:

ФреймворкХарнесс
Определяет workflow, шаги, DAGНикакого workflow. Решает LLM.
Абстрагирует нижележащие инструментыВыставляет сырые инструменты (shell, CDP, fs)
Предписывает, что агент должен делатьПредписывает, что агент может делать
Ломается, когда задача не ложится в шаблонГнётся, потому что шаблона нет
Оптимизирован под тупые моделиОптимизирован под умные модели

В 2023 фреймворки имели смысл. Модели не были достаточно надёжны, чтобы доверить им сырые возможности, поэтому строили рельсы. LangChain, AutoGPT, CrewAI — все вариации на тему «дай я поведу этого LLM за руку по пайплайну».

Модели поумнели. Рельсы стали стоить больше, чем экономили.

Claude Code был первым настоящим харнессом

Claude Code вышел в начале 2025 с радикальным дизайном: никакой оркестрации, никакого планировщика, никакого memory-графа. Просто LLM с Bash, Read, Edit, Write, Grep и парой веб-инструментов. И всё.

Ставка была в том, что достаточно умная модель, которой дали доступ к файловой системе и shell, справится с оркестрацией сама. И справилась. Карпаты назвал это «единственным ИИ-инструментом, которым я реально пользуюсь каждый день».

Codex пришёл к той же форме несколькими месяцами позже. Другая модель, та же философия: дай LLM песочницу и инструменты, а не фреймворк.

Browser Harness — это тот же паттерн, пришедший в автоматизацию браузера. Вместо Selenium-подобных определений шагов или Playwright-подобных API, обёрнутых в скафолдинг агента, ты получаешь сырое соединение по Chrome DevTools Protocol и файл helpers, который агент переписывает, когда что-то ломается.

Это и есть «self-healing». Никакой retry-логики, никакой fallback-стратегии, никакого парсера состояний ошибок. LLM читает ошибку, правит helper, пробует снова. Кодовая база и есть память.

Почему харнессы выигрывают

Три вещи сдвинулись параллельно:

  1. Использование инструментов стало надёжным. Claude 4 и GPT-5 следуют схемам инструментов достаточно последовательно, чтобы не нужен был валидатор, ловящий битые вызовы.
  2. Контекстные окна перестали быть дефицитом. Контекст в 1М токенов означает, что ты можешь загрузить всю кодовую базу, весь DOM, всю документацию — и дать модели перечитывать, а не заранее чанкать.
  3. Модели научились восстанавливаться. Когда вызов падает, современный LLM правит инструмент, пишет новый helper или меняет подход. Авторы фреймворков писали эту логику восстановления вручную. Модель делает это лучше.

Как только эти три вещи становятся правдой, каждый слой абстракции между LLM и сырым инструментом превращается в обузу. Это код, который ты поддерживаешь, который модели приходится обходить, который ломается, когда задача хоть чуть-чуть отклоняется от паттерна.

Фраза Грега выдаёт: «Вызываю любого найти задачу, которая НЕ работает». У фреймворков есть известные режимы отказа. У харнессов нет — точнее, их режим отказа — это сам LLM, а он продолжает улучшаться.

Стек харнессов в 2026

Если прищуриться, видно, как формируется стек:

  • Coding harness: Claude Code, Codex, agent-режим Cursor
  • Browser harness: Browser Harness (Browser Use)
  • Research harness: autoresearch Карпаты — program.md + Claude Code
  • Data harness: зарождающийся — прямой доступ к БД + shell

Общая форма: LLM + сырой инструмент + постоянная рабочая директория. Рабочая директория — место, где накапливается контекст, где пишутся helpers, где между ходами живёт память модели.

Харнессы работают на контексте

Вот часть, которая важна, если ты строишь с этими инструментами: харнесс хорош ровно настолько, насколько хорош контекст, который ты ему даёшь.

Claude Code без CLAUDE.md — это обобщённый код-ассистент. Claude Code с тщательно ведомым CLAUDE.md, библиотекой референсных документов и папкой знаний, которую можно grep’нуть — это то, чем пользуется Карпаты. Это 10x-версия.

То же и с Browser Harness. helpers.py, который он правит на лету, стартует откуда-то. Если ты засеваешь это «откуда-то» паттернами, auth-флоу и спецификой сайтов, которую задокументировал — у харнесса есть рычаг. Если даёшь ему пустой файл, ему придётся всё открывать заново.

Работу делает харнесс. Твоё преимущество живёт в библиотеке контекста.

Где встраивается Save

Каждый харнесс, о котором мы говорили, читает Markdown с диска. CLAUDE.md, AGENTS.md, референсные документы, сохранённые страницы документации, API-заметки — всё в Markdown, всё в папке, которую агент видит.

Save — конвертер в один клик из любой веб-страницы в чистый Markdown. Страницы документации, посты в блогах, ответы на Stack Overflow, README на GitHub, API-референсы — всё, что следующему харнессу нужно будет прочитать.

Люди, которые в 2026 выжимают максимум из Claude Code и Browser Harness, не строят больше фреймворка. Они курируют лучшие библиотеки. Харнесс бесплатен. Контекст — это ров.


Save превращает любую веб-страницу в Markdown, который твой ИИ-харнесс может прочитать — установи расширение и начни строить библиотеку, которая сделает твоих агентов умнее.