Selama dua tahun, jawaban default untuk “bagaimana cara memberikan pengetahuan saya ke LLM?” adalah RAG. Bangun database vektor. Potong dokumen Anda. Embed-kan semuanya. Jalankan pencarian tetangga terdekat saat query. Gabungkan hasilnya kembali ke dalam prompt.

Berhasil. Cukup. Siapa pun yang pernah meluncurkan sistem RAG tahu kegagalannya: potongan yang kehilangan konteks, embedding yang mengambil bagian yang salah, peringkat yang tak transparan, tanpa asal-usul, kasus tepi aneh ketika pengguna bertanya sesuatu yang indeksnya tidak disetel untuk itu.

Pada April 2026, Andrej Karpathy memposting alur kerja yang hampir tidak melakukan satu pun dari itu dan bekerja lebih baik untuk pengetahuan pribadi. Ia menyebutnya LLM Knowledge Bases. Arsitekturnya hanyalah folder berisi file markdown, sebuah LLM dengan akses filesystem, dan sebuah kebiasaan. VentureBeat menyebutnya “perpustakaan markdown yang terus berkembang yang dikelola oleh AI” — deskripsi yang menangkap apa yang sebenarnya baru.

Pola post-RAG sudah ada di sini. Artikel ini menjelaskan apa itu, mengapa berhasil, dan bagaimana Save Vault membuatnya dapat diakses tanpa pengaturan developer apa pun.

Apa yang Coba Diselesaikan RAG

Masalah aslinya: LLM memiliki jendela konteks tetap, basis pengetahuan Anda lebih besar dari jendela tersebut, sehingga Anda memerlukan cara untuk mengambil irisan yang relevan untuk setiap pertanyaan.

Pada tahun 2023, vektor adalah jawaban yang jelas. Embed semuanya, cari berdasarkan kesamaan, suntikkan potongan top-k. Ini terpadu dengan baik bersama jendela konteks kecil GPT-3.5 dan Claude 1. Seluruh pola “AI startup” adalah “RAG di atas X.”

Tiga hal berubah.

Jendela konteks meledak. Claude meluncurkan konteks 1M token tahun ini. Gemini dan GPT-5 serupa. Satu juta token kira-kira 750.000 kata — cukup untuk menampung wiki kecil seluruhnya dalam memori.
Filesystem MCP diluncurkan. LLM sekarang bisa membuka file di disk secara langsung. Mereka tidak memerlukan potongan yang telah diindeks sebelumnya. Mereka bisa menavigasi, membaca, dan membaca ulang seperti manusia.
LLM semakin baik dalam membaca. Claude Opus 4 bisa mencerna ratusan file dalam satu sesi dan bernalar melintasinya secara koheren. Hambatannya bergeser dari “kualitas pengambilan” ke “apa yang sebenarnya dibutuhkan manusia.”

Begitu ketiga hal itu benar, RAG mulai terlihat seperti solusi pengganti untuk keterbatasan yang tidak lagi ada.

Seperti Apa Pola Wiki Markdown

Pengaturan Karpathy, disederhanakan:

Folder raw. Setiap halaman web yang ingin ia simpan disimpan sebagai file .md di direktori raw/. Ia menggunakan Obsidian Web Clipper untuk ini.
Tahap kompilasi. Secara berkala, agen LLM (Claude Code dalam kasusnya) membaca semua yang ada di raw/, menghasilkan halaman konsep, menulis ringkasan, dan membuat tautan balik. Ini menghasilkan wiki terstruktur di atas materi mentah.
Loop query. Ketika ia punya pertanyaan, ia bertanya ke LLM. LLM mencari wiki, membuka file yang relevan, dan menjawab menggunakan kontennya.
Tahap lint. Sesekali LLM memindai wiki untuk mencari inkonsistensi, data yang hilang, atau koneksi baru yang layak dicatat.

Wiki penelitian saat ini berisi ~100 artikel dan ~400K kata. Ia mengajukan pertanyaan kompleks dan mendapatkan jawaban bersumber kembali.

Tidak ada database vektor. Tidak ada model embedding. Tidak ada strategi pemotongan. Tidak ada peringkat pengambilan. Hanya file markdown, struktur folder, dan LLM yang bisa membacanya.

Mengapa Ini Bekerja Lebih Baik dari RAG (Untuk Ini)

Pola wiki memiliki keunggulan struktural yang tidak bisa ditandingi RAG tanpa menjadi wiki itu sendiri.

Asal-usul gratis. Setiap jawaban mengutip sebuah file. Anda bisa membukanya, membacanya, mengeditnya, menghapusnya. Tidak ada “embedding-nya bilang begitu.”

Pengeditan sepele. File markdown adalah teks. Buka di editor mana pun. Perbaiki typo. Tambahkan catatan. Hapus bagian. Query berikutnya langsung mencerminkan perubahannya. Tidak ada langkah re-embedding.

Struktur berkembang majemuk. Ketika LLM mengkompilasi wiki, ia membangun tautan balik dan halaman konsep. Wiki semakin baik semakin banyak Anda menyimpan, karena LLM memiliki lebih banyak konteks untuk menghubungkan entri baru. Indeks vektor hanya menjadi lebih besar.

Portabilitas total. Folder berisi file .md bekerja di Obsidian, VS Code, GitHub, Logseq, vim, atau cat. Database vektor adalah kotak hitam yang membutuhkan runtime tertentu untuk dibaca.

Anda bisa membacanya sendiri. Ini kedengarannya jelas, tapi ini adalah keunggulan terbesar. Anda kadang-kadang ingin tahu apa yang ada di basis pengetahuan Anda. Dengan RAG, itu adalah query pelaporan. Dengan markdown, cukup ls.

Tradeoff yang jujur: RAG masih menang ketika Anda memiliki jutaan dokumen, akses multi-tenant, atau kendala latensi ketat. Untuk pengetahuan pribadi — bacaan, riset, domain Anda — pola wiki kini secara ketat lebih baik.

Bagian yang Hilang: Ingestasi

Pola Karpathy memiliki asumsi diam-diam: bahwa mendapatkan markdown yang bersih ke folder raw/ itu mudah. Bagi developer yang sudah menggunakan Obsidian Web Clipper, memang demikian. Bagi semua orang lain, inilah langkah di mana alur kerja mati.

Web Clipper bisa kesulitan dengan halaman berbayar, situs JavaScript-berat, konten video, thread X, dan apa pun yang dinamis. Orang-orang menyimpan HTML yang berantakan, menyerah, dan menyimpulkan “wiki itu bukan untuk saya.”

Ekstensi Save ada khusus untuk memperbaiki langkah ini. Ia menggunakan Gemini untuk mengekstrak konten bersih dari halaman sembarang, termasuk:

Artikel di balik paywall yang bisa Anda akses
Video YouTube (transkripsi lengkap + ringkasan AI)
Thread X/Twitter
Instagram reels dan TikTok captions (ditranskripsi)
Diskusi Reddit
Dokumentasi dengan blok kode tetap utuh
SPA dinamis yang membuat clipper tradisional tersedak

Satu klik. Markdown bersih di sisi lain. Taruh di folder.

Bagian Lain yang Hilang: Pengaturan MCP

Pola Karpathy juga mengasumsikan Anda bisa mengkonfigurasi server MCP. Bagi pengguna Claude Code ini adalah satu baris cd. Bagi semua orang yang menggunakan Claude Desktop, itu berarti mengedit file konfigurasi JSON dan me-restart aplikasi — dan mendapatkan path yang benar, dan mengingat untuk melakukannya lagi ketika Anda memindahkan folder.

Save Vault menggabungkan kedua bagian yang hilang menjadi satu aplikasi:

Ekstensi Save mengumpan markdown bersih ke Save Vault secara otomatis
Save Vault menulis ke ~/Documents/Save Vault/ yang diorganisir ke dalam basis pengetahuan (subfolder)
Server MCP bawaan mengekspos list_knowledge_bases, list_files, read_file, dan search ke Claude
Toggle “Connect to Claude” di menu bar menghubungkan server MCP ke Claude Desktop dan Claude Code, tanpa pengeditan JSON

Hasilnya adalah pola Karpathy dengan tepi kasar yang dihaluskan. Simpan halaman → mendarat di vault Anda → Claude bisa menjawab pertanyaan tentangnya. Tidak ada database vektor, tidak ada pemotongan, tidak ada embedding.

Coba Sekarang

Instal ekstensi Chrome Save
Instal Save Vault dari savemarkdown.co
Aktifkan Connect to Claude di menu bar
Simpan 10 hal yang ingin Anda baca
Buka Claude dan ajukan pertanyaan yang menghubungkan semuanya

Itulah alur kerja post-RAG. Ini sudah menggantikan database vektor untuk pengetahuan pribadi. Satu-satunya yang tersisa adalah mulai membangun milik Anda.

Save Vault gratis. Ekstensi Save gratis untuk 3 simpanan per bulan, $3,99/bln tanpa batas. savemarkdown.co.