如何用 Save 构建 LLM 知识库
Andrej Karpathy 最近分享了他如何使用 Markdown 文件为 AI 研究构建个人知识库的方法。他的做法很简单:收集源文档,将其转换为 Markdown,整理到文件夹中,让 LLM 处理整个集合。
结果?一个真正了解你所知道的 AI。
这不是只有研究人员才能用的技术。任何每天使用 Claude、ChatGPT 或任何 LLM 的人都可以构建同样的东西——只需几分钟,而不是几小时。
什么是 LLM 知识库?
这是你电脑上一个装满你关心的主题的 Markdown 文件的文件夹。你读过的文章,看过的 YouTube 视频,参考的文档,塑造你思维的推文。
当你给 LLM 访问这个文件夹的权限时,它不再是通用助手。它成为你的助手——一个理解你的领域、你的来源和你的上下文的助手。
把它想象成第二大脑,但 AI 可以真正读取的那种。
第一步:用 Save 收集你的来源
这是大多数人卡住的地方。手动复制网络内容、清理 HTML、格式化——这很繁琐。这正是 Save 要解决的问题。
Save 是一个 Chrome 扩展,可以将任何网页转换为干净、结构化的 Markdown。一键完成。
你可以保存的内容:
- 文章和博客文章
- YouTube 视频(完整字幕 + 摘要)
- Twitter/X 串
- 文档和 API 参考
- Reddit 讨论
- 学术论文
- LinkedIn 帖子
- 你有权限访问的付费内容
每次保存都产生一个干净的 .md 文件——没有 HTML、没有广告、没有导航菜单。只是内容,用标题、列表和代码块正确结构化。
第二步:组织你的知识文件夹
创建对你的工作有意义的文件夹结构。保持简单:
my-knowledge/
marketing/
distribution-strategies.md
competitor-analysis.md
pricing-frameworks.md
product/
user-research-findings.md
feature-prioritization.md
industry/
market-trends-2026.md
karpathy-llm-knowledge-bases.md
ai-agent-workflows.md
每次在网上读到有价值的内容,用 Save 保存并放入正确的文件夹。随着时间推移,这会累积成一个全面的知识库,没有通用的 LLM 能与之匹敌。
第三步:将知识库连接到 LLM
以下是让 LLM 访问你的知识文件夹的几种方式:
选项 1:Claude Code(最强大)
如果你使用 Claude Code,在你的知识文件夹中打开终端并开始会话。Claude 可以完全访问每个文件,可以搜索、读取、交叉引用并在整个集合中推理。
cd my-knowledge
claude
Claude Code 可以读取数百个 Markdown 文件,找到它们之间的联系,回答复杂问题,甚至维护索引文件——正如 Karpathy 所描述的那样。
这是最强大的选项,因为 Claude 可以主动浏览你的文件,而不仅仅是将它们作为上下文接收。
选项 2:Claude.ai Projects
在 claude.ai 上创建一个 Project,将你的 Markdown 文件上传到项目知识库。该项目中的每次对话都能访问你的文档。
- 直接拖放文件
- 每个项目支持 200+ 个文件
- 知识在对话间持久存在
- 在任何有浏览器的设备上都可用
最适合:想要简单设置而不使用终端的人。
选项 3:Claude Desktop + MCP
如果你使用 Claude Desktop,可以安装文件系统 MCP 服务器,让 Claude 直接访问计算机上的文件夹。
在 Claude Desktop 配置中添加以下内容:
{
"mcpServers": {
"knowledge-base": {
"command": "npx",
"args": [
"-y",
"@modelcontextprotocol/server-filesystem",
"/path/to/my-knowledge"
]
}
}
}
Claude Desktop 随后可以按需读取你知识文件夹中的任何文件——无需上传。
选项 4:复制粘贴(最简单)
对于快速问题,只需将一个或几个 Markdown 文件拖入任何 Claude 或 ChatGPT 对话中即可。无需设置。
这适用于一次性查询,但无法扩展。对于真正的知识库工作流,使用上面的选项之一。
为什么 Markdown 让这一切成为可能
你不能把原始 HTML 提供给 LLM 并期望得到好结果。HTML 充满了导航、广告、脚本和样式——浪费令牌并混淆模型的噪音。
Markdown 是 LLM 的原生语言。它们在来自 GitHub、文档网站和开发者博客的数百万个 Markdown 文件上进行训练。当你给 LLM 干净的 Markdown 时:
- 10 倍更少的令牌,与原始 HTML 相比
- 更好的理解——模型专注于内容,而不是解析
- 适当的结构——标题、列表和代码块被保留
- 通用兼容性——适用于 Claude、ChatGPT、Gemini 或任何 LLM
这就是 Save 存在的原因。它不只是复制文本——它使用 AI 提取有意义的内容,并将其结构化为 LLM 能完美理解的干净 Markdown。
复利效应
以下是建立这种习惯后发生的事情:
第 1 周: 你有 10 个 Markdown 文件。Claude 可以回答关于这些特定文章的问题。
第 1 个月: 你有 50+ 个文件。Claude 可以交叉引用来源,找到规律,给你提供自己永远不会发现的洞见。
第 3 个月: 你有 200+ 个文件。你建立了一个了解你的行业、竞争对手、框架和思维的个人研究助手。你问的每个问题都能得到基于你策划的知识而非通用训练数据的答案。
正如 Karpathy 所指出的,一旦你的知识库足够大,你就可以提出复杂问题,LLM 会在你的整个集合中研究答案。不需要花哨的 RAG 设置——只需有组织的 Markdown 文件。
60 秒内开始
- 从 Chrome 应用商店安装 Save(免费)
- 在你的电脑上创建一个
my-knowledge文件夹 - 访问你最近发现有价值的文章
- 点击 Save——Markdown 文件立即下载
- 将其移至你的知识文件夹
- 在 Claude Code 中打开文件夹,上传到 Claude Project,或设置 MCP
从现在起你保存的每篇文章都让你的 AI 更聪明。这会复合积累。
今天开始构建你的 LLM 知识库。安装 Save——免费开始。