마크다운 위키가 조용히 RAG를 대체하고 있다. 그 이유는?
2년 동안, “LLM에 내 지식을 어떻게 제공하나요?”라는 질문의 기본 답변은 RAG였습니다. 벡터 데이터베이스를 구축하세요. 문서를 청크로 분할하세요. 임베딩하세요. 쿼리 시 nearest-neighbor 검색을 실행하세요. 결과를 프롬프트에 다시 엮어 넣으세요.
효과가 있었습니다. 어느 정도는요. 실제로 RAG 시스템을 출시해본 사람이라면 누구나 실패 유형을 알고 있습니다: 컨텍스트를 잃어버리는 청크, 잘못된 구절을 검색하는 임베딩, 불투명한 랭킹, 출처 없음, 인덱스가 최적화되지 않은 것을 사용자가 물어볼 때의 이상한 엣지 케이스.
2026년 4월, Andrej Karpathy는 이 중 거의 아무것도 하지 않고 개인 지식에 더 잘 작동하는 워크플로우를 공개했습니다. 그는 이것을 LLM Knowledge Bases라고 부릅니다. 아키텍처는 그냥 마크다운 파일 폴더, 파일시스템 접근이 가능한 LLM, 그리고 습관입니다. VentureBeat은 이를 “AI가 유지 관리하는 진화하는 마크다운 라이브러리”라고 묘사했는데 — 이는 실제로 새로운 것이 무엇인지를 포착하는 설명입니다.
포스트-RAG 패턴이 도래했습니다. 이 글은 그것이 무엇인지, 왜 작동하는지, 그리고 Save Vault가 어떻게 개발자 설정 없이 접근 가능하게 만드는지 설명합니다.
RAG가 해결하려 했던 것
원래 문제: LLM은 고정된 컨텍스트 창을 가지고 있고, 지식 베이스는 창보다 크기 때문에 각 질문에 대한 관련 슬라이스를 검색할 방법이 필요합니다.
2023년에는 벡터가 명백한 답이었습니다. 모든 것을 임베딩하고, 유사성으로 검색하고, 상위 k개 청크를 주입합니다. GPT-3.5와 Claude 1의 작은 컨텍스트 창과 잘 맞았습니다. 전체 “AI 스타트업” 패턴은 “X에 대한 RAG”였습니다.
세 가지가 바뀌었습니다.
- 컨텍스트 창이 폭발적으로 커졌습니다. Claude는 올해 1M 토큰 컨텍스트를 출시했습니다. Gemini와 GPT-5도 비슷합니다. 백만 토큰은 약 750,000 단어로 — 작은 위키 전체를 메모리에 담을 수 있습니다.
- 파일시스템 MCP가 출시됐습니다. LLM이 이제 디스크의 파일을 직접 열 수 있습니다. 미리 인덱싱된 청크가 필요 없습니다. 사람처럼 탐색하고, 읽고, 다시 읽을 수 있습니다.
- LLM이 읽기를 더 잘하게 됐습니다. Claude Opus 4는 한 세션에서 수백 개의 파일을 처리하고 일관되게 추론할 수 있습니다. 병목은 “검색 품질”에서 “인간이 실제로 필요한 것”으로 이동했습니다.
이 세 가지가 모두 사실이 되자, RAG는 더 이상 존재하지 않는 제한에 대한 임시방편처럼 보이기 시작했습니다.
마크다운 위키 패턴이 어떻게 보이는가
Karpathy의 설정을 단순화하면:
- Raw 폴더. 보관하고 싶은 모든 웹 페이지를
raw/디렉토리에.md파일로 저장합니다. 이를 위해 Obsidian Web Clipper를 사용합니다. - 컴파일 단계. 주기적으로, LLM 에이전트(그의 경우 Claude Code)가
raw/의 모든 것을 읽고, 개념 페이지를 생성하고, 요약을 작성하고, 백링크를 만듭니다. 이는 원자재 위에 구조화된 위키를 생성합니다. - 쿼리 루프. 질문이 생기면 LLM에게 묻습니다. 위키를 검색하고, 관련 파일을 열고, 내용을 사용해 답변합니다.
- 린트 단계. 가끔 LLM이 위키에서 불일치, 누락된 데이터, 기록할 만한 새로운 연결을 스캔합니다.
그의 현재 연구 위키는 약 100개의 기사와 약 400K 단어입니다. 복잡한 질문을 하면 출처가 있는 답변을 받습니다.
벡터 데이터베이스가 없습니다. 임베딩 모델이 없습니다. 청킹 전략이 없습니다. 검색 랭킹이 없습니다. 그냥 마크다운 파일, 폴더 구조, 그것들을 읽을 수 있는 LLM만 있습니다.
왜 RAG보다 더 잘 작동하는가 (이런 용도에서)
위키 패턴은 RAG가 자체적으로 위키가 되지 않고는 맞출 수 없는 구조적 장점이 있습니다.
출처가 무료입니다. 모든 답변이 파일을 인용합니다. 열어볼 수 있고, 읽을 수 있고, 편집할 수 있고, 삭제할 수 있습니다. “임베딩이 그렇게 말했다”는 없습니다.
편집이 간단합니다. 마크다운 파일은 텍스트입니다. 어떤 에디터에서든 열 수 있습니다. 오타를 수정하세요. 메모를 추가하세요. 섹션을 삭제하세요. 다음 쿼리가 즉시 변경 사항을 반영합니다. 재임베딩 단계가 없습니다.
구조가 복리로 늘어납니다. LLM이 위키를 컴파일할 때 백링크와 개념 페이지를 구축합니다. 더 많이 저장할수록 위키가 더 좋아집니다, LLM이 새 항목을 연결할 컨텍스트가 더 많기 때문입니다. 벡터 인덱스는 그냥 커집니다.
이식성이 완전합니다. .md 파일 폴더는 Obsidian, VS Code, GitHub, Logseq, vim 또는 cat에서 작동합니다. 벡터 데이터베이스는 읽기 위해 특정 런타임이 필요한 블랙박스입니다.
직접 읽을 수 있습니다. 당연해 보이지만, 이것이 가장 큰 장점입니다. 때로는 지식 베이스에 무엇이 있는지 알고 싶을 것입니다. RAG에서는 보고 쿼리입니다. 마크다운에서는 ls입니다.
솔직한 트레이드오프: RAG는 수백만 개의 문서, 멀티 테넌트 접근, 또는 엄격한 지연 시간 제약이 있을 때(수백만 개의 도움말 기사 코퍼스에 대한 고객 지원 챗봇을 생각해보세요) 여전히 이깁니다. 개인 지식 — 당신의 독서, 당신의 연구, 당신의 도메인 — 에서는 위키 패턴이 이제 명백히 더 낫습니다.
빠진 부분: 수집
Karpathy의 패턴에는 조용한 가정이 있습니다: raw/ 폴더에 깨끗한 마크다운을 넣는 것이 쉽다는 것입니다. 이미 Obsidian Web Clipper를 사용하는 개발자들에게는 어느 정도 그렇습니다. 다른 모든 사람들에게는, 이것이 워크플로우가 죽는 단계입니다.
Web Clipper는 페이월이 있는 페이지, JavaScript가 많은 사이트, 비디오 콘텐츠, X 스레드, 동적인 모든 것에서 어려움을 겪을 수 있습니다. 사람들은 어지러운 HTML을 저장하고, 포기하고, “위키 방식은 나에게 맞지 않는다”고 결론짓습니다.
Save 확장 프로그램은 정확히 이 단계를 고치기 위해 존재합니다. Gemini를 사용해 임의의 페이지에서 깨끗한 콘텐츠를 추출합니다:
- 접근 권한이 있는 페이월 뒤의 기사
- YouTube 동영상 (전체 스크립트 + AI 요약)
- X/Twitter 스레드
- Instagram 릴스와 TikTok 캡션 (전사)
- Reddit 토론
- 코드 블록이 그대로 유지되는 문서
- 전통적인 클리퍼가 막히는 동적 SPA
클릭 한 번. 반대편에서 깨끗한 마크다운이 나옵니다. 폴더에 넣으세요.
다른 빠진 부분: MCP 설정
Karpathy의 패턴은 또한 MCP 서버를 구성할 수 있다고 가정합니다. Claude Code 사용자에게는 한 줄짜리 cd입니다. Claude Desktop을 사용하는 모든 사람에게는 JSON 설정 파일을 편집하고 앱을 재시작하는 것을 의미합니다 — 그리고 경로를 올바르게 입력하고, 폴더를 이동할 때 다시 하는 것을 기억해야 합니다.
Save Vault는 두 개의 빠진 부분을 하나의 앱으로 압축합니다:
- Save 확장 프로그램이 자동으로 깨끗한 마크다운을 Save Vault에 공급합니다
- Save Vault는
~/Documents/Save Vault/에 지식 베이스(하위 폴더)로 구성하여 씁니다 - 내장 MCP 서버가 Claude에
list_knowledge_bases,list_files,read_file,search를 노출합니다 - 메뉴 바의 “Connect to Claude” 토글이 MCP 서버를 Claude Desktop과 Claude Code에 연결합니다, JSON 편집 없이
결과는 거친 부분이 다듬어진 Karpathy 패턴입니다. 페이지를 저장하면 → vault에 도착하고 → Claude가 이에 대해 질문에 답할 수 있습니다. 벡터 데이터베이스 없이, 청킹 없이, 임베딩 없이.
실제로 어떻게 보이는가
경쟁사를 조사한다고 상상해보세요.
1일. 그들의 가격 페이지, 블로그 포스트 3개, 시드 라운드에 대한 Hacker News 스레드를 저장합니다. 경쟁사 KB에 5개의 파일이 있습니다.
5일. Claude에게 묻습니다: “이 회사는 지난 1년 동안 어떤 가격 변동을 했고, 고객들은 어떻게 반응했나요?” Claude가 경쟁사 KB를 검색하고, 관련 파일을 읽고, 가격 페이지를 인용하고, HN 스레드의 감정을 파악하고 — 모두 출처가 있는 — 답변합니다.
30일. 경쟁사, 고객, AI 연구에 걸쳐 40개의 파일이 있습니다. Claude에게 각 KB를 위키로 컴파일해달라고 요청합니다. 개념 페이지를 작성하고, 링크하고, 모순점을 표시합니다. 이제 검색 엔진처럼 쿼리할 수 있는 세 개의 살아있는 위키가 있습니다, 하지만 더 낫습니다 — 당신이 큐레이션한 것만 포함되어 있기 때문입니다.
90일. 당신의 위키는 살 수 있는 어떤 애널리스트 보고서보다 크고, 어떤 컨설턴트 덱보다 최신이며, 완전히 당신 것입니다. 모든 주장은 저장한 파일로 추적됩니다.
이것이 마찰이 사라진 개인 지식 베이스가 실제로 어떻게 느껴지는지입니다. RAG는 이것을 제공해야 했는데 하지 못했습니다. Karpathy 패턴은 — 수집과 MCP 부분이 당신을 위해 연결되면 — 합니다.
시도해보기
- Save Chrome 확장 프로그램 설치
- savemarkdown.co에서 Save Vault 설치
- 메뉴 바에서 Connect to Claude 토글
- 읽으려 했던 것 10개를 저장
- Claude를 열고 그것들을 연결하는 질문을 해보세요
이것이 포스트-RAG 워크플로우입니다. 이미 개인 지식의 벡터 데이터베이스를 대체하고 있습니다. 남은 것은 당신의 것을 만들기 시작하는 것뿐입니다.
Save Vault는 무료입니다. Save 확장 프로그램은 월 3회 저장 무료, 무제한 $5.99/월. savemarkdown.co.