← Wróć do bloga

Wiki Markdown po cichu zastępuje RAG. Oto dlaczego.

· Save Team
ragllmknowledge-basekarpathymcpaisave-vaultmarkdown

Przez dwa lata standardową odpowiedzią na pytanie „jak dać LLM moją wiedzę?” był RAG. Zbuduj bazę wektorową. Podziel dokumenty na fragmenty. Osadź je. Uruchom wyszukiwanie najbliższego sąsiada podczas zapytania. Zszyj wyniki z powrotem do promptu.

Działało. Mniej więcej. Każdy, kto faktycznie wdrożył system RAG, zna tryby awaryjne: fragmenty tracące kontekst, osadzenia pobierające zły fragment, nieprzejrzyste rankingi, brak proweniencji, dziwne przypadki brzegowe gdy użytkownik pyta o coś, do czego indeks nie był dostrojony.

W kwietniu 2026 roku Andrej Karpathy opublikował przepływ pracy, który nie robi prawie niczego z tego i działa lepiej dla osobistej wiedzy. Nazywa go LLM Knowledge Bases. Architektura to po prostu folder z plikami markdown, LLM z dostępem do systemu plików i nawyk. VentureBeat nazwał to „ewoluującą biblioteką markdown utrzymywaną przez AI” — opis, który ujmuje to, co jest naprawdę nowe.

Wzorzec post-RAG jest tutaj. Ten artykuł wyjaśnia, czym jest, dlaczego działa i jak Save Vault czyni go dostępnym bez żadnej konfiguracji deweloperskiej.

Co RAG próbował rozwiązać

Oryginalny problem: LLM mają stałe okno kontekstowe, Twoja baza wiedzy jest większa niż okno, więc potrzebujesz sposobu na pobranie odpowiedniego fragmentu dla każdego pytania.

W 2023 roku wektory były oczywistą odpowiedzią. Osadź wszystko, szukaj według podobieństwa, wstrzyknij top-k fragmentów. Dobrze komponowało się z małymi oknami kontekstowymi GPT-3.5 i Claude 1. Cały wzorzec „startupu AI” to było „RAG nad X.”

Trzy rzeczy się zmieniły.

  1. Okna kontekstowe eksplodowały. Claude w tym roku dostarczył 1M-tokenowy kontekst. Gemini i GPT-5 są podobne. Milion tokenów to około 750 000 słów — wystarczająco, by pomieścić małe wiki w całości w pamięci.
  2. Filesystem MCP został uruchomiony. LLM mogą teraz bezpośrednio otwierać pliki na dysku. Nie potrzebują wstępnie zindeksowanych fragmentów. Mogą nawigować, czytać i ponownie czytać jak człowiek.
  3. LLM stały się lepsze w czytaniu. Claude Opus 4 może przetworzyć setki plików w jednej sesji i rozumować spójnie między nimi. Wąskie gardło przesunęło się z „jakości wyszukiwania” na „czego człowiek właściwie potrzebuje.”

Gdy te trzy rzeczy stały się prawdą, RAG zaczął wyglądać jak obejście ograniczeń, które już nie istnieją.

Jak wygląda wzorzec wiki Markdown

Konfiguracja Karpathy’ego, uproszczona:

  1. Surowy folder. Każda strona internetowa, którą chce zachować, jest zapisywana jako plik .md w katalogu raw/. Używa do tego Obsidian Web Clipper.
  2. Przebieg kompilacji. Okresowo agent LLM (Claude Code w jego przypadku) czyta wszystko w raw/, generuje strony konceptów, pisze podsumowania i tworzy backlinki. Produkuje to ustrukturyzowane wiki na surowym materiale.
  3. Pętla zapytań. Gdy ma pytanie, pyta LLM. Przeszukuje wiki, otwiera odpowiednie pliki i odpowiada używając treści.
  4. Przebieg lint. Okazjonalnie LLM skanuje wiki w poszukiwaniu niespójności, brakujących danych lub nowych połączeń wartych odnotowania.

Jego obecne wiki badawcze ma ~100 artykułów i ~400 tys. słów. Zadaje mu złożone pytania i otrzymuje odpowiedzi z podanymi źródłami.

Żadnej bazy wektorowej. Żadnego modelu osadzania. Żadnej strategii dzielenia. Żadnego rankingu wyszukiwania. Tylko pliki markdown, struktura folderów i LLM, który może je czytać.

Dlaczego działa lepiej niż RAG (w tym przypadku)

Wzorzec wiki ma strukturalne zalety, których RAG nie może dorównać bez sam stania się wiki.

Proweniencja jest darmowa. Każda odpowiedź cytuje plik. Możesz go otworzyć, przeczytać, edytować, usunąć. Żadnego „osadzenie tak powiedziało.”

Edytowanie jest trywialne. Plik markdown to tekst. Otwórz go w dowolnym edytorze. Popraw literówkę. Dodaj notatkę. Usuń sekcję. Następne zapytanie natychmiast odzwierciedla zmianę. Nie ma kroku ponownego osadzania.

Struktura się kumuluje. Gdy LLM kompiluje wiki, buduje backlinki i strony konceptów. Wiki staje się lepsze im więcej zapisujesz, bo LLM ma więcej kontekstu do łączenia nowych wpisów. Indeks wektorowy po prostu rośnie.

Przenośność jest całkowita. Folder plików .md działa w Obsidian, VS Code, GitHub, Logseq, vim lub cat. Baza wektorowa to czarna skrzynka, do której potrzebujesz konkretnego środowiska uruchomieniowego.

Możesz to sam przeczytać. To brzmi oczywisto, ale to największa zaleta. Czasami będziesz chciał wiedzieć, co jest w Twojej bazie wiedzy. Z RAG to zapytanie raportowe. Z markdown to ls.

Uczciwy kompromis: RAG nadal wygrywa gdy masz miliony dokumentów, dostęp wielodostępowy lub twarde ograniczenia latencji (pomyśl chatboty obsługi klienta nad korpusem milionów artykułów pomocy). Dla osobistej wiedzy — Twojej lektury, Twoich badań, Twojej domeny — wzorzec wiki jest teraz ściśle lepszy.

Brakujący element: Wprowadzanie danych

Wzorzec Karpathy’ego ma ciche założenie: że łatwo jest wstawić czysty markdown do folderu raw/. Dla deweloperów, którzy już używają Obsidian Web Clipper, tak jest. Dla wszystkich innych to jest krok, w którym przepływ pracy umiera.

Web Clipper może mieć problemy ze stronami za paywallem, witrynami z dużą ilością JavaScript, treściami wideo, wątkami X i wszystkim dynamicznym. Ludzie zapisują bałaganiarski HTML, poddają się i dochodzą do wniosku, że „to wiki-coś nie jest dla mnie.”

Rozszerzenie Save istnieje specjalnie, aby naprawić ten krok. Używa Gemini do wyodrębniania czystej treści z dowolnych stron, w tym:

  • Artykuły za paywallem, do których masz dostęp
  • Filmy YouTube (pełna transkrypcja + podsumowanie AI)
  • Wątki X/Twitter
  • Reelsy Instagram i podpisy TikTok (transkrybowane)
  • Dyskusje Reddit
  • Dokumentacja z nienaruszonymi blokami kodu
  • Dynamiczne SPA, na których tradycyjne klippery się zawieszają

Jedno kliknięcie. Czysty markdown po drugiej stronie. Wrzuć do folderu.

Drugi brakujący element: Konfiguracja MCP

Wzorzec Karpathy’ego zakłada też, że możesz skonfigurować serwer MCP. Dla użytkowników Claude Code to jednoliniowe cd. Dla wszystkich używających Claude Desktop oznacza to edycję pliku konfiguracyjnego JSON i ponowne uruchomienie aplikacji — i prawidłowe podanie ścieżki, i pamiętanie o ponownym wykonaniu tego przy przenoszeniu folderów.

Save Vault kompresuje oba brakujące elementy w jedną aplikację:

  • Rozszerzenie Save automatycznie wstawia czysty markdown do Save Vault
  • Save Vault zapisuje do ~/Documents/Save Vault/ zorganizowanego w bazy wiedzy (podfoldery)
  • Wbudowany serwer MCP udostępnia list_knowledge_bases, list_files, read_file i search dla Claude
  • Przełącznik „Połącz z Claude” w pasku menu podłącza serwer MCP do Claude Desktop i Claude Code, bez edycji JSON

Wynikiem jest wzorzec Karpathy’ego z wygładzonymi szorstkimi krawędziami. Zapisz stronę → trafia do Twojego vaultu → Claude może odpowiadać na pytania na jej temat. Żadnej bazy wektorowej, żadnego dzielenia, żadnych osadzeń.

Jak to wygląda w praktyce

Wyobraź sobie, że badasz konkurenta.

Dzień 1. Zapisujesz ich stronę cenową, trzy posty na blogu i wątek Hacker News o ich rundzie seed. Pięć plików w Twojej KB Konkurenci.

Dzień 5. Pytasz Claude: „Jakie zmiany cenowe przeprowadziła ta firma w ciągu ostatniego roku i jak zareagowali klienci?” Claude przeszukuje Twoją KB Konkurenci, czyta odpowiednie pliki, cytuje stronę cenową, wydobywa nastroje z wątku HN i odpowiada — wszystko z podanymi źródłami.

Dzień 30. Masz 40 plików w Konkurenci, Klienci i Badania AI. Prosisz Claude o skompilowanie każdej KB do wiki. Pisze strony konceptów, linkuje je, oznacza sprzeczności. Masz teraz trzy żywe wiki, które możesz odpytywać jak wyszukiwarki, ale lepiej — bo zawierają tylko to, co Ty wyselekcjonowałeś.

Dzień 90. Twoje wiki są większe niż jakikolwiek raport analityczny, który mógłbyś kupić, bardziej aktualne niż jakakolwiek prezentacja konsultanta i całkowicie Twoje. Każde twierdzenie jest skojarzone z plikiem, który zapisałeś.

Tak naprawdę wygląda osobista baza wiedzy, gdy tarcie znika. RAG miał to dostarczyć i nie dostarczył. Wzorzec Karpathy’ego to robi — gdy elementy wprowadzania danych i MCP są dla Ciebie połączone.

Wypróbuj

  1. Zainstaluj rozszerzenie Save dla Chrome
  2. Zainstaluj Save Vault z savemarkdown.co
  3. Włącz Połącz z Claude w pasku menu
  4. Zapisz 10 rzeczy, które chciałeś przeczytać
  5. Otwórz Claude i zadaj pytanie, które je łączy

To jest przepływ pracy post-RAG. Już zastępuje bazy wektorowe dla osobistej wiedzy. Jedyne co pozostało, to zacząć budować własną.


Save Vault jest darmowy. Rozszerzenie Save jest darmowe przez 3 zapisy miesięcznie, $3,99/mc bez limitu. savemarkdown.co.