← Quay lại blog

Wiki Markdown Đang Thầm Lặng Thay thế RAG. Đây là Lý do.

· Save Team
ragllmknowledge-basekarpathymcpaisave-vaultmarkdown

Trong hai năm, câu trả lời mặc định cho “làm thế nào để tôi cung cấp tri thức của mình cho LLM?” là RAG. Xây dựng cơ sở dữ liệu vector. Chia nhỏ tài liệu. Nhúng chúng. Chạy tìm kiếm láng giềng gần nhất tại thời điểm truy vấn. Ghép kết quả lại vào prompt.

Nó hoạt động. Phần nào. Bất kỳ ai thực sự triển khai hệ thống RAG đều biết các điểm thất bại: các đoạn mất ngữ cảnh, các nhúng truy xuất đoạn văn sai, xếp hạng mờ đục, không có nguồn gốc, các trường hợp ngoại lệ kỳ lạ khi người dùng hỏi điều gì đó mà chỉ mục không được điều chỉnh cho.

Vào tháng 4 năm 2026, Andrej Karpathy đăng một quy trình làm việc hầu như không làm bất kỳ điều đó nào và hoạt động tốt hơn cho tri thức cá nhân. Ông gọi nó là LLM Knowledge Bases. Kiến trúc chỉ là một thư mục các tệp markdown, một LLM có quyền truy cập hệ thống tệp, và một thói quen. VentureBeat gọi nó là “một thư viện markdown đang phát triển được duy trì bởi AI” — một mô tả nắm bắt những gì thực sự mới mẻ.

Mô hình post-RAG đã đến đây. Bài viết này giải thích nó là gì, tại sao nó hoạt động, và cách Save Vault làm cho nó có thể tiếp cận mà không cần bất kỳ thiết lập nào của nhà phát triển.

RAG Đang Cố Giải Quyết Vấn đề Gì

Vấn đề ban đầu: LLM có cửa sổ ngữ cảnh cố định, cơ sở tri thức của bạn lớn hơn cửa sổ, vì vậy bạn cần một cách để truy xuất lát cắt liên quan cho mỗi câu hỏi.

Năm 2023, vector là câu trả lời rõ ràng. Nhúng mọi thứ, tìm kiếm theo độ tương đồng, tiêm các đoạn top-k. Nó kết hợp tốt với các cửa sổ ngữ cảnh nhỏ của GPT-3.5 và Claude 1. Toàn bộ mô hình “AI startup” là “RAG trên X.”

Ba điều đã thay đổi.

  1. Cửa sổ ngữ cảnh bùng nổ. Claude đã ra mắt ngữ cảnh 1M token trong năm nay. Gemini và GPT-5 tương tự. Một triệu token xấp xỉ 750.000 từ — đủ để chứa một wiki nhỏ hoàn toàn trong bộ nhớ.
  2. Filesystem MCP đã ra mắt. LLM bây giờ có thể mở tệp trực tiếp trên đĩa. Chúng không cần các đoạn được lập chỉ mục trước. Chúng có thể điều hướng, đọc và đọc lại như con người.
  3. LLM trở nên tốt hơn trong việc đọc. Claude Opus 4 có thể xử lý hàng trăm tệp trong một phiên và lý luận trên chúng một cách mạch lạc. Điểm nghẽn đã chuyển từ “chất lượng truy xuất” sang “người dùng thực sự cần gì.”

Một khi ba điều đó là sự thật, RAG bắt đầu trông giống như một giải pháp thay thế cho những hạn chế không còn tồn tại.

Mô hình Wiki Markdown Trông Như Thế Nào

Thiết lập của Karpathy, được đơn giản hóa:

  1. Thư mục raw. Mọi trang web ông muốn giữ được lưu dưới dạng tệp .md trong thư mục raw/. Ông sử dụng Obsidian Web Clipper cho việc này.
  2. Lần biên dịch. Định kỳ, một agent LLM (Claude Code trong trường hợp của ông) đọc mọi thứ trong raw/, tạo các trang khái niệm, viết tóm tắt và tạo các liên kết ngược. Điều này tạo ra một wiki có cấu trúc trên đầu tài liệu thô.
  3. Vòng lặp truy vấn. Khi ông có câu hỏi, ông hỏi LLM. Nó tìm kiếm wiki, mở các tệp liên quan và trả lời bằng nội dung.
  4. Lần lint. Thỉnh thoảng LLM quét wiki để tìm sự không nhất quán, dữ liệu thiếu hoặc các kết nối mới đáng ghi lại.

Wiki nghiên cứu hiện tại của ông có khoảng 100 bài viết và khoảng 400K từ. Ông đặt câu hỏi phức tạp và nhận lại các câu trả lời có nguồn gốc.

Không có cơ sở dữ liệu vector. Không có mô hình nhúng. Không có chiến lược chia nhỏ. Không có xếp hạng truy xuất. Chỉ là các tệp markdown, cấu trúc thư mục và LLM có thể đọc chúng.

Tại sao Nó Hoạt động Tốt hơn RAG (Cho Điều Này)

Mô hình wiki có những lợi thế cấu trúc mà RAG không thể so sánh mà không tự trở thành wiki.

Nguồn gốc miễn phí. Mỗi câu trả lời trích dẫn một tệp. Bạn có thể mở nó, đọc nó, chỉnh sửa nó, xóa nó. Không có “nhúng đã nói như vậy.”

Chỉnh sửa là tầm thường. Một tệp markdown là văn bản. Mở nó trong bất kỳ trình soạn thảo nào. Sửa lỗi chính tả. Thêm ghi chú. Xóa một phần. Truy vấn tiếp theo phản ánh sự thay đổi ngay lập tức. Không cần bước nhúng lại.

Cấu trúc nhân lên. Khi LLM biên dịch wiki, nó xây dựng các liên kết ngược và trang khái niệm. Wiki trở nên tốt hơn khi bạn lưu nhiều hơn, vì LLM có nhiều ngữ cảnh hơn để kết nối các mục mới. Một chỉ mục vector chỉ trở nên lớn hơn.

Tính khả chuyển là toàn diện. Một thư mục các tệp .md hoạt động trong Obsidian, VS Code, GitHub, Logseq, vim, hoặc cat. Cơ sở dữ liệu vector là một hộp đen bạn cần một runtime cụ thể để đọc.

Bạn có thể tự đọc nó. Điều này nghe có vẻ hiển nhiên, nhưng đây là lợi thế lớn nhất. Đôi khi bạn sẽ muốn biết những gì trong cơ sở tri thức của mình. Với RAG, đó là một truy vấn báo cáo. Với markdown, đó là ls.

Sự đánh đổi thực sự: RAG vẫn thắng khi bạn có hàng triệu tài liệu, truy cập nhiều người dùng hoặc các ràng buộc độ trễ cứng (hãy nghĩ chatbot hỗ trợ khách hàng trên kho hàng triệu bài viết trợ giúp). Đối với tri thức cá nhân — việc đọc, nghiên cứu và lĩnh vực của bạn — mô hình wiki bây giờ tốt hơn hẳn.

Phần Còn Thiếu: Nhập liệu

Mô hình của Karpathy có một giả định thầm lặng: việc đưa markdown sạch vào thư mục raw/ là dễ dàng. Đối với các nhà phát triển đã sử dụng Obsidian Web Clipper, phần nào là vậy. Đối với mọi người khác, đây là bước mà quy trình làm việc chết.

Web Clipper có thể gặp khó khăn với các trang có paywall, các trang nặng JavaScript, nội dung video, luồng X, và bất cứ thứ gì động. Mọi người lưu HTML rối rắm, từ bỏ và kết luận “wiki không phải dành cho tôi.”

Tiện ích mở rộng Save tồn tại đặc biệt để sửa bước này. Nó sử dụng Gemini để trích xuất nội dung sạch từ các trang tùy ý, bao gồm:

  • Bài viết đằng sau paywall mà bạn có quyền truy cập
  • Video YouTube (bản ghi đầy đủ + tóm tắt AI)
  • Luồng X/Twitter
  • Instagram reels và TikTok captions (được phiên âm)
  • Thảo luận Reddit
  • Tài liệu với các khối code còn nguyên
  • SPA động mà các clipper truyền thống bị nghẹt

Một lần nhấp. Markdown sạch ở đầu ra. Thả vào thư mục.

Phần Còn Thiếu Khác: Thiết lập MCP

Mô hình của Karpathy cũng giả định rằng bạn có thể cấu hình một máy chủ MCP. Đối với người dùng Claude Code, đây là một dòng cd. Đối với tất cả mọi người sử dụng Claude Desktop, điều đó có nghĩa là chỉnh sửa tệp cấu hình JSON và khởi động lại ứng dụng — và điền đường dẫn đúng, và nhớ làm lại khi bạn di chuyển thư mục.

Save Vault thu gọn cả hai phần còn thiếu thành một ứng dụng:

  • Tiện ích mở rộng Save đưa markdown sạch vào Save Vault tự động
  • Save Vault ghi vào ~/Documents/Save Vault/ được tổ chức thành các cơ sở tri thức (thư mục con)
  • Một máy chủ MCP tích hợp hiển thị list_knowledge_bases, list_files, read_filesearch cho Claude
  • Nút “Connect to Claude” trong thanh menu kết nối máy chủ MCP vào Claude Desktop và Claude Code, không cần chỉnh sửa JSON

Kết quả là mô hình Karpathy với các cạnh thô được làm mịn. Lưu một trang → nó vào vault của bạn → Claude có thể trả lời câu hỏi về nó. Không có cơ sở dữ liệu vector, không có chia nhỏ, không có nhúng.

Điều Này Trông Như Thế Nào Trong Thực tế

Hãy tưởng tượng bạn đang nghiên cứu đối thủ cạnh tranh.

Ngày 1. Bạn lưu trang giá của họ, ba bài viết blog và một luồng Hacker News về vòng hạt giống của họ. Năm tệp trong KB Competitors của bạn.

Ngày 5. Bạn hỏi Claude: “Công ty này đã thực hiện những thay đổi giá nào trong năm qua, và khách hàng đã phản ứng như thế nào?” Claude tìm kiếm KB Competitors của bạn, đọc các tệp liên quan, trích dẫn trang giá, nêu lên tâm lý của luồng HN và trả lời — tất cả có nguồn gốc.

Ngày 30. Bạn có 40 tệp trải rộng trên Competitors, CustomersAI Research. Bạn yêu cầu Claude biên dịch mỗi KB thành một wiki. Nó viết các trang khái niệm, liên kết chúng, gắn cờ các mâu thuẫn. Bây giờ bạn có ba wiki sống mà bạn có thể truy vấn như công cụ tìm kiếm, nhưng tốt hơn — vì chúng chỉ chứa những gì bạn đã tuyển chọn.

Ngày 90. Các wiki của bạn lớn hơn bất kỳ báo cáo phân tích nào bạn mua, cập nhật hơn bất kỳ tài liệu tư vấn nào, và hoàn toàn là của bạn. Mọi tuyên bố đều có nguồn gốc từ một tệp bạn đã lưu.

Đây là cảm giác thực sự của một cơ sở tri thức cá nhân một khi sự ma sát đã biến mất. RAG được cho là cung cấp điều này và đã không thành công. Mô hình Karpathy thì có — một khi các phần nhập liệu và MCP được kết nối cho bạn.

Thử Nó

  1. Cài đặt tiện ích mở rộng Chrome Save
  2. Cài đặt Save Vault từ savemarkdown.co
  3. Bật Connect to Claude trong thanh menu
  4. Lưu 10 thứ bạn đang muốn đọc
  5. Mở Claude và đặt câu hỏi kết nối chúng lại với nhau

Đó là quy trình post-RAG. Nó đang thay thế cơ sở dữ liệu vector cho tri thức cá nhân. Điều duy nhất còn lại là bắt đầu xây dựng của bạn.


Save Vault miễn phí. Tiện ích mở rộng Save miễn phí 3 lần lưu mỗi tháng, $5.99/tháng không giới hạn. savemarkdown.co.