블로그로 돌아가기

프레임워크가 아니라 하네스 — AI 도구의 새로운 형태

·
#ai#agents#browser-use#claude-code#codex#harness#llm#markdown

2026년 4월 18일, Browser Use의 공동 창업자 Gregor Zunic이 이렇게 올렸다.

Introducing: Browser Harness. A self-healing harness that can complete virtually any browser task. We got tired of browser frameworks restricting the LLM. So we removed the framework.

프레임워크 없음. 직접 CDP. Chrome으로 가는 웹소켓 하나. 에이전트가 그 자리에서 편집하는 helpers.py. Claude Code와 Codex에 드롭인 가능. 트윗은 여기.

이건 단순한 브라우저 자동화 도구가 아니다. 2026년 들어 조용히 AI 툴링을 장악하고 있는 패턴을 지금까지 가장 명료하게 진술한 것이다 — 하네스다.

하네스란 무엇인가

하네스는 LLM이 유용한 일을 할 수 있게 해주는, LLM 주위의 최소한의 래퍼다. 도구 표면 — 보통 파일 시스템, 셸, 가끔 HTTP — 을 노출시키고, 이후엔 길을 비켜준다.

두 가지 형태를 비교해보자.

프레임워크하네스
워크플로, 스텝, DAG를 정의워크플로 없음. LLM이 결정.
기반 도구를 추상화해 감춘다날것의 도구(shell, CDP, fs)를 노출
에이전트가 무엇을 해야 하는지 규정에이전트가 무엇을 할 수 있는지 규정
작업이 템플릿에 안 맞으면 부서진다템플릿이 없어서 휘어진다
멍청한 모델용으로 최적화똑똑한 모델용으로 최적화

2023년엔 프레임워크가 말이 됐다. 모델이 날것의 능력을 맡길 만큼 신뢰할 수 없었으니 가드레일을 지었다. LangChain, AutoGPT, CrewAI — 모두 “이 LLM 손을 잡고 파이프라인을 돌자”의 변주였다.

모델이 똑똑해졌다. 가드레일은 절약하는 것보다 비용이 더 들기 시작했다.

Claude Code가 첫 진짜 하네스였다

Claude Code는 2025년 초, 과격한 설계로 출시됐다 — 오케스트레이션 없음, 플래너 모듈 없음, 메모리 그래프 없음. 그저 Bash, Read, Edit, Write, Grep과 몇 개의 웹 도구를 가진 LLM. 그게 전부였다.

베팅은 이랬다 — 파일 시스템 접근과 셸을 가진, 충분히 똑똑한 모델이라면 오케스트레이션을 스스로 할 수 있다. 그리고 그랬다. Karpathy는 이를 “내가 실제로 매일 쓰는 유일한 AI 도구”라고 불렀다.

Codex는 몇 달 뒤 같은 형태에 안착했다. 다른 모델, 같은 철학 — LLM에 샌드박스와 도구를 주어라, 프레임워크가 아니라.

Browser Harness는 이 패턴이 브라우저 자동화에 도착한 것이다. Selenium 스타일의 스텝 정의나, 에이전트 스캐폴딩에 감싼 Playwright 스타일 API 대신, 날것의 Chrome DevTools Protocol 연결과, 무언가 깨지면 에이전트가 다시 쓰는 helpers 파일을 받는다.

그게 “self-healing” 부분이다. 리트라이 로직 없음, 폴백 전략 없음, 에러 상태 파서 없음. LLM이 에러를 읽고, helper를 편집하고, 다시 시도한다. 코드베이스가 곧 기억이다.

하네스가 이기는 이유

세 가지가 나란히 바뀌었다.

  1. 도구 사용이 신뢰할 만해졌다. Claude 4와 GPT-5는 잘못된 호출을 잡아내는 밸리데이터 계층이 필요 없을 정도로 도구 스키마를 일관되게 따른다.
  2. 컨텍스트 윈도가 더는 희소하지 않다. 100만 토큰 컨텍스트는 코드베이스 전체, DOM 전체, 문서 전체를 통째로 올릴 수 있다는 뜻이다 — 사전에 청크로 자를 필요 없이 모델이 다시 읽게 하면 된다.
  3. 모델이 회복을 배웠다. 호출이 실패하면, 현대 LLM은 도구를 편집하거나, 새로운 helper를 쓰거나, 접근법을 바꾼다. 프레임워크 저자들은 그 회복 로직을 손으로 썼다. 모델이 더 잘한다.

이 세 가지가 참이 되는 순간, LLM과 날것의 도구 사이의 모든 추상화 계층은 부채가 된다. 당신이 유지보수해야 하고, 모델이 우회해야 하며, 작업이 패턴에서 조금이라도 벗어나면 부서지는 코드다.

Greg의 한 줄이 단서다 — “작동하지 않는 작업을 찾아보라고 누구에게든 도전한다”. 프레임워크에는 알려진 실패 모드가 있다. 하네스에는 없다 — 아니 더 정확히는, 그 실패 모드는 LLM 자체이고, LLM은 계속 좋아지고 있다.

2026년의 하네스 스택

눈을 가늘게 뜨면 스택이 형성되는 게 보인다.

  • 코딩 하네스: Claude Code, Codex, Cursor 에이전트 모드
  • 브라우저 하네스: Browser Harness (Browser Use)
  • 리서치 하네스: Karpathy의 autoresearch — program.md + Claude Code
  • 데이터 하네스: 떠오르는 중 — DB 직접 접근 + 셸

공통된 형태: LLM + 날것의 도구 + 영속적인 작업 디렉터리. 작업 디렉터리는 컨텍스트가 쌓이는 곳, helper가 쓰이는 곳, 턴과 턴 사이 모델의 기억이 사는 곳이다.

하네스는 컨텍스트 위에서 돌아간다

이 도구들로 뭔가를 만들고 있다면 중요한 건 이거다 — 하네스는 당신이 주는 컨텍스트만큼만 좋다.

CLAUDE.md가 없는 Claude Code는 범용 코딩 어시스턴트다. 잘 정리된 CLAUDE.md, 레퍼런스 문서 라이브러리, grep할 수 있는 지식 폴더를 갖춘 Claude Code — 그게 Karpathy가 쓰는 것이다. 그게 10x 버전이다.

Browser Harness도 마찬가지. 그 자리에서 편집되는 helpers.py는 어딘가에서 시작한다. 그 어딘가에 당신이 문서화한 패턴, 인증 플로, 사이트별 특이점을 심어두면 — 하네스에 지렛대가 생긴다. 빈 파일을 주면, 처음부터 다 다시 발견해야 한다.

일은 하네스가 한다. 당신의 우위는 컨텍스트 라이브러리에 산다.

Save가 들어가는 자리

우리가 이야기한 모든 하네스는 디스크에서 Markdown을 읽는다. CLAUDE.md, AGENTS.md, 레퍼런스 문서, 저장된 문서 페이지, API 노트 — 전부 Markdown이고, 전부 에이전트가 볼 수 있는 폴더 안에 있다.

Save는 어떤 웹 페이지든 한 번의 클릭으로 깔끔한 Markdown으로 변환하는 도구다. 문서 페이지, 블로그 포스트, Stack Overflow 답변, GitHub README, API 레퍼런스 — 당신이 다음에 돌릴 하네스가 읽어야 할 것이면 무엇이든.

2026년에 Claude Code와 Browser Harness에서 가장 많이 뽑아내는 사람들은 프레임워크를 더 쌓고 있지 않다. 더 나은 라이브러리를 큐레이션하고 있다. 하네스는 공짜다. 해자는 컨텍스트다.


Save는 어떤 웹 페이지든 AI 하네스가 읽을 수 있는 Markdown으로 바꿔준다 — 확장 프로그램을 설치하고, 에이전트를 더 똑똑하게 만들 라이브러리를 쌓기 시작하라.