如何用 Save 建構 LLM 知識庫
Andrej Karpathy 最近分享了他如何使用 Markdown 檔案為 AI 研究建構個人知識庫的方法。他的做法很簡單:收集來源文件,將其轉換為 Markdown,整理到資料夾中,讓 LLM 處理整個集合。
結果?一個真正了解你所知道的 AI。
這不是只有研究人員才能用的技術。任何每天使用 Claude、ChatGPT 或任何 LLM 的人都可以建構同樣的東西——只需幾分鐘,而不是幾小時。
什麼是 LLM 知識庫?
這是你電腦上一個裝滿你關心的主題的 Markdown 檔案的資料夾。你讀過的文章,看過的 YouTube 影片,參考的文件,塑造你思維的推文。
當你給 LLM 存取這個資料夾的權限時,它不再是通用助手。它成為你的助手——一個理解你的領域、你的來源和你的上下文的助手。
把它想像成第二大腦,但 AI 可以真正讀取的那種。
第一步:用 Save 收集你的來源
這是大多數人卡住的地方。手動複製網路內容、清理 HTML、格式化——這很繁瑣。這正是 Save 要解決的問題。
Save 是一個 Chrome 擴充功能,可以將任何網頁轉換為乾淨、結構化的 Markdown。一鍵完成。
你可以儲存的內容:
- 文章和部落格文章
- YouTube 影片(完整字幕 + 摘要)
- Twitter/X 串
- 文件和 API 參考
- Reddit 討論
- 學術論文
- LinkedIn 貼文
- 你有權限存取的付費內容
每次儲存都產生一個乾淨的 .md 檔案——沒有 HTML、沒有廣告、沒有導覽選單。只是內容,用標題、清單和程式碼區塊正確結構化。
第二步:組織你的知識資料夾
建立對你的工作有意義的資料夾結構。保持簡單:
my-knowledge/
marketing/
distribution-strategies.md
competitor-analysis.md
pricing-frameworks.md
product/
user-research-findings.md
feature-prioritization.md
industry/
market-trends-2026.md
karpathy-llm-knowledge-bases.md
ai-agent-workflows.md
每次在網路上讀到有價值的內容,用 Save 儲存並放入正確的資料夾。隨著時間推移,這會累積成一個全面的知識庫,沒有通用的 LLM 能與之匹敵。
第三步:將知識庫連接到 LLM
以下是讓 LLM 存取你的知識資料夾的幾種方式:
選項一:Claude Code(最強大)
如果你使用 Claude Code,在你的知識資料夾中開啟終端機並開始會話。Claude 可以完全存取每個檔案,可以搜尋、讀取、交叉引用並在整個集合中推理。
cd my-knowledge
claude
Claude Code 可以讀取數百個 Markdown 檔案,找到它們之間的聯繫,回答複雜問題,甚至維護索引檔案——正如 Karpathy 所描述的那樣。
這是最強大的選項,因為 Claude 可以主動瀏覽你的檔案,而不僅僅是將它們作為上下文接收。
選項二:Claude.ai Projects
在 claude.ai 上建立一個 Project,將你的 Markdown 檔案上傳到專案知識庫。該專案中的每次對話都能存取你的文件。
- 直接拖放檔案
- 每個專案支援 200+ 個檔案
- 知識在對話間持久存在
- 在任何有瀏覽器的裝置上都可用
最適合:想要簡單設定而不使用終端機的人。
選項三:Claude Desktop + MCP
如果你使用 Claude Desktop,可以安裝檔案系統 MCP 伺服器,讓 Claude 直接存取電腦上的資料夾。
在 Claude Desktop 設定中新增以下內容:
{
"mcpServers": {
"knowledge-base": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"/path/to/my-knowledge"
]
}
}
}
Claude Desktop 隨後可以按需讀取你知識資料夾中的任何檔案——無需上傳。
選項四:複製貼上(最簡單)
對於快速問題,只需將一個或幾個 Markdown 檔案拖入任何 Claude 或 ChatGPT 對話中即可。無需設定。
這適用於一次性查詢,但無法擴展。對於真正的知識庫工作流程,使用上面的選項之一。
為什麼 Markdown 讓這一切成為可能
你不能把原始 HTML 提供給 LLM 並期望得到好結果。HTML 充滿了導覽列、廣告、腳本和樣式——浪費令牌並混淆模型的雜訊。
Markdown 是 LLM 的原生語言。它們在來自 GitHub、文件網站和開發者部落格的數百萬個 Markdown 檔案上進行訓練。當你給 LLM 乾淨的 Markdown 時:
- 10 倍更少的令牌,與原始 HTML 相比
- 更好的理解——模型專注於內容,而不是解析
- 適當的結構——標題、清單和程式碼區塊被保留
- 通用相容性——適用於 Claude、ChatGPT、Gemini 或任何 LLM
這就是 Save 存在的原因。它不只是複製文字——它使用 AI 擷取有意義的內容,並將其結構化為 LLM 能完美理解的乾淨 Markdown。
複利效應
以下是建立這種習慣後發生的事情:
第 1 週: 你有 10 個 Markdown 檔案。Claude 可以回答關於這些特定文章的問題。
第 1 個月: 你有 50+ 個檔案。Claude 可以交叉引用來源,找到規律,給你提供自己永遠不會發現的洞見。
第 3 個月: 你有 200+ 個檔案。你建立了一個了解你的行業、競爭對手、框架和思維的個人研究助手。你問的每個問題都能得到基於你策劃的知識而非通用訓練資料的答案。
正如 Karpathy 所指出的,一旦你的知識庫足夠大,你就可以提出複雜問題,LLM 會在你的整個集合中研究答案。不需要花俏的 RAG 設定——只需有組織的 Markdown 檔案。
60 秒內開始
- 從 Chrome 線上應用程式商店安裝 Save(免費)
- 在你的電腦上建立一個
my-knowledge資料夾 - 造訪你最近發現有價值的文章
- 點擊 Save——Markdown 檔案立即下載
- 將其移至你的知識資料夾
- 在 Claude Code 中開啟資料夾,上傳到 Claude Project,或設定 MCP
從現在起你儲存的每篇文章都讓你的 AI 更聰明。這會複合積累。
今天開始建構你的 LLM 知識庫。安裝 Save——免費開始。