← 返回博客

如何将 arXiv 论文保存为 Markdown

2026年3月31日 · Save Team

arxivresearchacademicpapers

arXiv 是 AI、物理、数学和计算机科学前沿研究的首选去处。但研究论文内容密集，arXiv 的界面不方便保存和整理你关注的论文。以下是如何将 arXiv 内容捕获为干净 Markdown 的方法。

为什么要将 arXiv 论文保存为 Markdown？

处理 arXiv 论文存在摩擦：

PDF 难以搜索 — 无法跨保存的论文进行全文搜索
摘要缺乏细节 — 但下载每篇 PDF 又难以应对
没有整理功能 — arXiv 没有文件夹、标签或个人库
AI 工具难以处理 PDF — Markdown 对 AI 来说容易得多

Save 从 arXiv 捕获的内容

摘要页面

论文标题和作者
完整摘要
类别和学科
提交日期
PDF 和 HTML 版本的链接

HTML 论文（arXiv HTML5）

arXiv 现在为许多论文提供 HTML 版本。Save 捕获：

带章节结构的完整论文文本
方程式和数学符号
表格和图形（引用形式）
参考文献和引用
定理和证明块

示例输出（摘要页面）

# Attention Is All You Need

**作者：** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**提交日期：** 2017 年 6 月 12 日
**类别：** cs.CL, cs.LG

---

## 摘要

主流序列转导模型基于复杂的循环或卷积神经网络……

**PDF：** https://arxiv.org/pdf/1706.03762
**HTML：** https://arxiv.org/html/1706.03762

使用场景

文献综述

将摘要和关键论文保存为 Markdown
在 Obsidian 中构建可搜索的文献数据库
使用 Dataview 查询按主题、年份或状态追踪论文
通过维基链接交叉引用论文

研究追踪

随着你所在领域论文发布时保存它们
使用 frontmatter 状态标签构建阅读队列
追踪哪些论文你已经读过、引用过或需要重新访问

AI 辅助研究

将保存的论文提供给 AI 进行摘要和解释
要求 AI 比较多篇论文的方法
从你的 Markdown 收藏生成文献综述草稿

最佳实践技巧

尽可能保存 HTML 版本 — 在 arXiv 页面点击「HTML」获取完整论文内容
摘要页面用于快速捕获 — 当你只需要元数据和摘要时保存摘要页面
添加 frontmatter — 保存后添加标签、状态和评分，以便更好地组织
批量保存 — 审阅会议论文集时，在一次会话中保存多篇论文

在 Obsidian 中整理论文

保存后添加 frontmatter：

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

然后用 Dataview 查询：

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

开始使用

从 Chrome 网上应用店安装 Save — 建立你的研究库。

有问题？请联系 [email protected]