Karpathy 的 Autoresearch 与 PROGRAM.md:让 AI 在你睡觉时运行实验
2026 年 3 月 7 日,前特斯拉 AI 总监、OpenAI 联合创始人 Andrej Karpathy 发布了一个让 AI 世界沸腾的仓库:autoresearch。
这个想法看似简单,实则深刻:给 AI 代理一个小型但真实的 LLM 训练环境,让它在夜间自主运行实验。它修改代码,训练 5 分钟,检查结果是否改善,保留或丢弃更改,然后重复。
你睡觉时,100 个实验在运行。零人工干预。
但有一点对编程的未来至关重要:人类不写 Python。人类写的是一个 Markdown 文件。
什么是 program.md?
autoresearch 的核心是一个名为 program.md 的文件。这是一个 Markdown 文档,作为 AI 代理的操作手册。
研究人员不再手动调整超参数、调整学习率或修改 Python 中的神经网络架构,而是在 program.md 中用自然语言写下指令。AI 代理读取这些指令,并据此自主修改训练代码(train.py)。
正如 Karpathy 所说:你不会像通常的研究人员那样去修改 Python 文件。相反,你在编写 program.md Markdown 文件,为 AI 代理提供上下文。
Autoresearch 如何工作
这个系统的优雅在于其简洁:
- 人类编辑
program.md— 设定研究目标、约束和策略 - AI 代理(Claude、Codex 或其他 LLM)读取
program.md并修改train.py - 训练恰好运行 5 分钟,测量验证损失(val_bpb)
- 若有改善,将更改作为 git commit 保留在特性分支上
- 若无改善,git 重置回起始状态
- 无限重复
整个训练代码库约 630 行 Python — 小到足以完整放入 LLM 的上下文窗口。这是有意为之的。代理需要理解整个系统才能做出智能修改。
实验结果
Karpathy 在一个深度为 12 的模型上让 autoresearch 运行了约两天。AI 代理自主发现了约 20 项改进,将 Time to GPT-2 基准从 2.02 小时降低到 1.80 小时 — 在零人工干预的情况下提升了 11%。
可视化中的每个点都代表一次完整的 LLM 训练运行。代理在自主循环中工作,在为神经网络架构、优化器和超参数找到更好设置时积累 git commits。
为什么 program.md 超越了 ML 研究的范畴
Autoresearch 关于 ML 训练,但它引入的模式是普适的:用 Markdown 文件编程 AI 代理。
这不是孤立的想法。看看整个 AI 生态系统正在发生什么:
| 文件 | 用途 |
|---|---|
program.md | 编程自主研究代理(Karpathy) |
AGENTS.md | 编程 AI 编程代理(60K+ 仓库,Linux 基金会) |
CLAUDE.md | 编程 Claude Code 行为 |
.cursorrules | 编程 Cursor AI 行为 |
llms.txt | 编程 AI 爬虫理解网站的方式 |
每次的模式都一样:人类写一个 Markdown 文件,AI 代理将其用作自主运作的指令。
Markdown 已经成为 AI 代理的编程语言。
从「氛围编程」到代理工程
Karpathy 本人在 2025 年创造了「vibe coding(氛围编程)」— 通过描述意图而非语法来编写代码的理念。但在 2026 年初,他说氛围编程已经过时了。
新词是什么?Agentic engineering(代理工程):99% 的时间你不直接写代码。你在协调执行工作的代理,扮演监督者角色。
Autoresearch 是这个理念最纯粹的体现。研究人员的工作从「你今天运行了多少实验?」转变为「你设定的实验方向有多好?」Markdown 文件就是你设定这些方向的方式。
这对知识工作者意味着什么
你不需要训练 LLM 才能从 autoresearch 中学到东西。这个模式适用于任何地方:
- 开发者写 AGENTS.md 来引导 AI 编程助手
- 研究人员写 program.md 来引导自主实验
- 内容创作者写提示词来引导 AI 写作助手
- 分析师写指令来引导 AI 数据处理流水线
在每种情况下,人类的工作正在变成:写出最好的 Markdown 指令。AI 负责执行。
构建以 Markdown 为核心的工作流程
如果 Markdown 正在成为 AI 代理的通用接口,那么拥有清晰的参考资料 Markdown 版本就变得至关重要。
当你为 autoresearch 写 program.md 或为代码库写 AGENTS.md 时,你会从你在网上看到的文档、论文、博客文章和示例中汲取灵感。Save 让你一键将这些内容捕获为干净的 Markdown — 随时可供参考、摘录或输入到代理指令中。
工作流程:在网上找到有用的内容,用 Save 将其保存为 Markdown,用它来写出更好的代理指令。
Save 将任何网页转换为干净的 Markdown — AI 代理最能理解的格式。构建你的参考库,写出更好的 AI 指令。免费试用 Save。