Saveを使ってLLMナレッジベースを構築する方法
Andrej KarpathyはAI研究のために個人ナレッジベースを構築する際に、どのようにmarkdownファイルを活用するかを最近シェアしました。そのアプローチはシンプルです。ソースドキュメントを集め、markdownに変換し、フォルダに整理して、LLMにコレクション全体を処理させる。
結果は?あなたが知っていることを本当に理解するAIの誕生です。
これは研究者専用のテクニックではありません。Claude、ChatGPT、あらゆるLLMを日常的に使う人なら誰でも同じものを構築できます――しかも時間がかかるどころか、数分で完成します。
LLMナレッジベースとは?
それはあなたが関心を持つトピックのmarkdownファイルで満たされた、コンピュータ上のフォルダです。読んだ記事。見たYouTube動画。参照するドキュメント。思考を形成したツイート。
LLMにこのフォルダへのアクセス権を与えると、汎用アシスタントではなくなります。あなたのアシスタントになります――あなたのドメイン、あなたのソース、あなたのコンテキストを理解する存在に。
第二の脳として考えてみてください。ただし、AIが実際に読めるものとして。
ステップ1:Saveでソースを収集する
ほとんどの人が躓くのはここです。ウェブコンテンツを手動でコピーし、HTMLをクリーンアップし、フォーマットする――これは非常に面倒な作業です。Saveはまさにこの問題を解決します。
Saveはあらゆるウェブページをクリーンで構造化されたmarkdownに変換するChrome拡張機能です。ワンクリックで。
保存できるコンテンツ:
- 記事とブログ投稿
- YouTube動画(全文文字起こし+要約)
- Twitter/Xスレッド
- ドキュメントとAPIリファレンス
- Redditのディスカッション
- 学術論文
- LinkedInの投稿
- アクセス権を持つ有料コンテンツ
各保存はクリーンな.mdファイルを生成します――HTMLなし、広告なし、ナビゲーションメニューなし。見出し、リスト、コードブロックで適切に構造化されたコンテンツだけです。
ステップ2:ナレッジフォルダを整理する
自分の仕事に合ったフォルダ構造を作りましょう。シンプルに保つことが大切です:
my-knowledge/
marketing/
distribution-strategies.md
competitor-analysis.md
pricing-frameworks.md
product/
user-research-findings.md
feature-prioritization.md
industry/
market-trends-2026.md
karpathy-llm-knowledge-bases.md
ai-agent-workflows.md
オンラインで価値ある情報を読むたびに、Saveで保存して適切なフォルダに入れましょう。時間とともに、どんな汎用LLMも太刀打ちできない包括的なナレッジベースへと蓄積されていきます。
ステップ3:ナレッジベースをLLMに接続する
ここから本当に強力になります。LLMにナレッジフォルダへのアクセス権を与える方法はいくつかあります:
オプション1:Claude Code(最も強力)
Claude Codeを使っている場合、ナレッジフォルダでターミナルを開いてセッションを開始します。Claudeはすべてのファイルに完全にアクセスでき、コレクション全体を検索、読み取り、相互参照、推論することができます。
cd my-knowledge
claude
Claude Codeは数百のmarkdownファイルを読み、それらの間の繋がりを見つけ、複雑な質問に答え、インデックスファイルを管理することさえできます――Karpathyが説明するのとまったく同じように。
Claudeはファイルをコンテキストとして受け取るだけでなく、能動的にファイルを閲覧できるため、これが最も強力なオプションです。
オプション2:Claude.ai Projects
claude.aiでProjectを作成し、markdownファイルをプロジェクトのナレッジベースにアップロードします。そのプロジェクト内のすべての会話がドキュメントにアクセスできます。
- ファイルを直接ドラッグ&ドロップ
- プロジェクトあたり200以上のファイルをサポート
- 会話をまたいでナレッジが持続
- ブラウザがあればどのデバイスでも動作
最適な用途:ターミナルを使わずにシンプルなセットアップを望む人向け。
オプション3:Claude Desktop + MCP
Claude Desktopを使っている場合、filesystem MCPサーバーをインストールして、コンピュータ上のフォルダへの直接アクセス権をClaudeに与えることができます。
Claude Desktopの設定に以下を追加します:
{
"mcpServers": {
"knowledge-base": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"/path/to/my-knowledge"
]
}
}
}
Claude Desktopはオンデマンドでナレッジフォルダ内の任意のファイルを読み取ることができます――アップロード不要です。
オプション4:コピー&ペースト(最もシンプル)
素早い質問には、1つまたは数個のmarkdownファイルをClaudeやChatGPTの会話にドラッグするだけです。セットアップは不要です。
一時的なクエリには機能しますが、スケールしません。本格的なナレッジベースワークフローには、上記のオプションのいずれかを使用してください。
なぜMarkdownがこれを機能させるのか
生のHTMLをLLMに与えても良い結果は期待できません。HTMLはナビゲーション、広告、スクリプト、スタイリングで肥大化しています――トークンを無駄にしてモデルを混乱させるノイズです。
MarkdownはLLMのネイティブ言語です。LLMはGitHub、ドキュメントサイト、開発者ブログの数百万のmarkdownファイルでトレーニングされました。クリーンなmarkdownをLLMに与えると:
- 10倍少ないトークン(生HTMLと比較して)
- より良い理解――モデルはコンテンツに集中し、パースに時間を使わない
- 適切な構造――見出し、リスト、コードブロックが保持される
- ユニバーサルな互換性――Claude、ChatGPT、Gemini、あらゆるLLMで動作
これがSaveが存在する理由です。テキストをコピーするだけでなく、AIを使って意味のあるコンテンツを抽出し、LLMが完璧に理解できるクリーンなmarkdownとして構造化します。
複利効果
この習慣を構築するとこうなります:
第1週: 10個のmarkdownファイルがあります。Claudeはそれらの特定の記事についての質問に答えることができます。
第1ヶ月: 50以上のファイルがあります。Claudeはソースを相互参照し、パターンを見つけ、自分では気づけなかった洞察を提供できます。
第3ヶ月: 200以上のファイルがあります。あなたの業界、競合他社、フレームワーク、思考を知る個人リサーチアシスタントを構築しました。あなたが尋ねるすべての質問は、汎用トレーニングデータではなく、あなた自身のキュレーションされたナレッジに基づいた答えを得ます。
Karpathyが指摘したように、ナレッジベースが十分に大きくなれば、複雑な質問をするとLLMがコレクション全体でその答えを調査します。高度なRAGセットアップは不要です――整理されたmarkdownファイルがあるだけで十分です。
60秒で始める
- Chrome ウェブストアからSaveをインストール(無料)
- コンピュータに
my-knowledgeフォルダを作成する - 最近価値があると感じた記事にアクセスする
- Saveをクリック――markdownファイルが即座にダウンロードされます
- ナレッジフォルダに移動する
- Claude Codeでフォルダを開くか、Claude Projectにアップロードするか、MCPを設定する
今から保存するすべての記事があなたのAIをより賢くします。それは複利で蓄積されます。
今日LLMナレッジベースの構築を始めましょう。Saveをインストール――無料で始められます。