← ブログに戻る

MarkdownウィキはRAGに静かに取って代わっている。その理由は。

· Save Team
ragllmknowledge-basekarpathymcpaisave-vaultmarkdown

2年間、「LLMに自分の知識を与えるにはどうするか?」という問いへのデフォルトの答えはRAGでした。ベクトルデータベースを構築する。ドキュメントをチャンクに分割する。埋め込みを作成する。クエリ時に最近傍検索を実行する。結果をプロンプトに繋ぎ合わせる。

機能はしました。なんとか。実際にRAGシステムを出荷したことのある人なら失敗モードを知っています:コンテキストを失うチャンク、間違ったパッセージを取得する埋め込み、不透明なランキング、出所なし、インデックスがチューニングされていないものをユーザーが尋ねたときの奇妙なエッジケース。

2026年4月、Andrej Karpathyがこれのほとんどをやらずにパーソナル知識ではより良く機能するワークフローを投稿しました。彼はそれをLLMナレッジベースと呼んでいます。アーキテクチャはただmarkdownファイルのフォルダ、ファイルシステムアクセスを持つLLM、そして習慣です。VentureBeatはそれを「AIによってメンテナンスされる進化するmarkdownライブラリ」と呼びました ― 実際に何が新しいかを捉えた説明です。

ポストRAGパターンが来ています。この記事では何であるか、なぜ機能するか、そしてSave Vaultが開発者のセットアップなしでどのようにアクセス可能にするかを説明します。

RAGが解決しようとしていたこと

元の問題:LLMは固定されたコンテキストウィンドウを持ち、あなたのナレッジベースはウィンドウより大きく、そのため各質問に関連するスライスを取得する方法が必要でした。

2023年には、ベクトルが明白な答えでした。すべてを埋め込み、類似性で検索し、上位kチャンクを注入する。これはGPT-3.5とClaude 1の小さなコンテキストウィンドウとうまく合っていました。「AIスタートアップ」パターン全体が「XのRAG」でした。

3つのことが変わりました。

  1. コンテキストウィンドウが爆発的に拡大。 Claudeは今年1Mトークンコンテキストを出荷しました。GeminiとGPT-5も同様。100万トークンは約75万語 ― 小さなwiki全体をメモリに保持するのに十分。
  2. ファイルシステムMCPが出荷。 LLMはディスク上のファイルを直接開けるようになりました。事前インデックスされたチャンクは必要ありません。人間のようにナビゲート、読み取り、再読み取りできます。
  3. LLMが読むのが上手くなった。 Claude Opus 4は1セッションで何百ものファイルを取り込み、それらを横断して一貫して推論できます。ボトルネックは「取得品質」から「人間が実際に何を必要としているか」に移りました。

これら3つが真実になると、RAGはもはや存在しない制限のための回避策のように見え始めました。

Markdownウィキパターンの見た目

Karpathyのセットアップをシンプルにすると:

  1. 生フォルダ。 保持したいウェブページはすべてraw/ディレクトリに.mdファイルとして保存されます。彼はそのためにObsidian Web Clipperを使っています。
  2. コンパイルパス。 定期的に、LLMエージェント(彼の場合はClaude Code)がraw/内のすべてを読み取り、コンセプトページを生成し、サマリーを書き、バックリンクを作成します。これにより生の素材の上に構造化されたwikiが生成されます。
  3. クエリループ。 質問があるとき、LLMに質問します。wikiを検索し、関連ファイルを開き、内容を使って回答します。
  4. リントパス。 時々LLMがwikiをスキャンして不整合、欠けているデータ、または記録する価値のある新しい接続を探します。

彼の現在のリサーチwikiは約100記事、約40万語です。複雑な質問をして、出典付きの回答を得ています。

ベクトルデータベースはありません。埋め込みモデルはありません。チャンキング戦略はありません。取得ランキングはありません。ただmarkdownファイル、フォルダ構造、そしてそれらを読めるLLMだけです。

なぜRAGより良く機能するか(これに対して)

ウィキパターンにはRAGがwikiそのものになることなく匹敵できない構造的優位性があります。

出所は無料。 すべての回答はファイルを引用します。開いて読んで編集して削除できます。「埋め込みがそう言った」ではありません。

編集は些細。 markdownファイルはテキストです。任意のエディタで開きます。タイポを直します。メモを追加します。セクションを削除します。次のクエリはすぐに変更を反映します。再埋め込みのステップはありません。

構造が複利で積み上がる。 LLMがwikiをコンパイルするとき、バックリンクとコンセプトページを構築します。LLMが新しいエントリを接続するためのより多くのコンテキストを持つため、保存が増えるほどwikiはより良くなります。ベクトルインデックスはただ大きくなるだけです。

ポータビリティは完全。 .mdファイルのフォルダはObsidian、VS Code、GitHub、Logseq、vim、またはcatで機能します。ベクトルデータベースは読み取るために特定のランタイムが必要なブラックボックスです。

自分で読めます。 これは当たり前のように聞こえますが、最大の優位性です。ナレッジベースに何があるかを知りたいと思うことがあるでしょう。RAGでは、それはレポートクエリです。markdownでは、それはlsです。

正直なトレードオフ:RAGは何百万ものドキュメント、マルチテナントアクセス、またはハードなレイテンシ制約(何百万ものヘルプ記事のコーパスに対するカスタマーサポートチャットボットを考えてください)がある場合に依然として勝ちます。パーソナル知識 ― あなたの読み物、リサーチ、ドメイン ― にとっては、ウィキパターンが今や厳密に優れています。

欠けているピース:インジェスチョン

Karpathyのパターンには静かな前提があります:クリーンなmarkdownをraw/フォルダに入れることが簡単だということ。すでにObsidian Web Clipperを使っている開発者にとっては、そうです。それ以外の人にとっては、これがワークフローが死ぬステップです。

Web Clipperはペイウォールされたページ、JavaScript多用のサイト、ビデオコンテンツ、Xスレッド、動的なものに苦労することがあります。人々はわかりにくいHTMLを保存し、諦めて、「wikiは自分向けではない」と結論付けます。

SaveエクステンションはこのステップをFixするために存在します。Geminiを使って任意のページからクリーンなコンテンツを抽出し、以下を含みます:

  • アクセス権があるペイウォール記事
  • YouTubeビデオ(完全なトランスクリプト + AIサマリー)
  • X/Twitterスレッド
  • InstagramリールとTikTokキャプション(文字起こし)
  • Redditディスカッション
  • コードブロックが完全なドキュメント
  • 従来のクリッパーが詰まる動的SPA

ワンクリック。反対側からクリーンなmarkdown。フォルダに入れる。

もう一つの欠けているピース:MCPセットアップ

Karpathyのパターンはまた、MCPサーバーを設定できることを前提としています。Claude Codeユーザーにとっては、これは1行のcdです。Claude Desktopを使っている人にとっては、JSONコンフィグファイルを編集してアプリを再起動することを意味します ― そしてパスを正しく取得して、フォルダを移動するときに再実行することを覚えておきます。

Save Vaultは両方の欠けているピースを1つのアプリに収束させます:

  • Saveエクステンションがクリーンなmarkdownを自動的にSave Vaultに送る
  • Save Vaultがナレッジベース(サブフォルダ)に整理されて~/Documents/Save Vault/に書き込む
  • 組み込みMCPサーバーがClaudeにlist_knowledge_baseslist_filesread_filesearchを公開
  • メニューバーの「Connect to Claude」トグルがMCPサーバーエントリをClaude DesktopとClaude Codeコンフィグに書き込み、JSON編集なし

結果はKarpathyパターンの荒削りな部分を削り取ったもの。ページを保存 → vaultに入る → Claudeがそれについて質問に答えられる。ベクトルデータベースなし、チャンキングなし、埋め込みなし。

実際どのように見えるか

競合他社を調査していると想像してください。

1日目。 価格ページ、3つのブログ投稿、シードラウンドについてのHacker Newsスレッドを保存。Competitors KBに5ファイル。

5日目。 Claudeに質問:「この会社は過去1年でどんな価格変更をし、顧客はどう反応したか?」 ClaudeがCompetitors KBを検索し、関連ファイルを読み、価格ページを引用し、HNスレッドのセンチメントを表面化し、回答 ― すべて出典付き。

30日目。 CompetitorsCustomersAI Researchに40ファイル。Claudeに各KBをwikiにコンパイルするよう依頼。コンセプトページを書き、リンクし、矛盾を指摘します。あなたは検索エンジンのようにクエリできる3つのリビングwikiを持っています、でもより良い ― あなたがキュレーションしたものだけが含まれているから。

90日目。 wikiは購入するアナリストレポートより大きく、コンサルタントデッキより現在のものであり、完全にあなたのものです。すべての主張は保存したファイルに出典があります。

これが摩擦がなくなるとパーソナルナレッジベースが実際にどんな感じかです。RAGはこれを提供するはずでしたが、しませんでした。Karpathyパターンは ― インジェスチョンとMCPの部分があなたのために繋がれれば。

試す

  1. Save Chromeエクステンションをインストール
  2. savemarkdown.coからSave Vaultをインストール
  3. メニューバーでConnect to Claudeをトグル
  4. 読もうとしていた10のものを保存
  5. Claudeを開いてそれらをまとめる質問をする

これがポストRAGワークフローです。すでにパーソナル知識のベクトルデータベースを置き換えています。残るはあなた自身のものを構築し始めることだけです。


Save Vaultは無料。Saveエクステンションは月3回の保存が無料、無制限は$3.99/月。savemarkdown.co