← 返回博客

如何将 arXiv 论文保存为 Markdown

· Save Team
arxivresearchacademicpapers

arXiv 是 AI、物理、数学和计算机科学前沿研究的首选去处。但研究论文内容密集,arXiv 的界面不方便保存和整理你关注的论文。以下是如何将 arXiv 内容捕获为干净 Markdown 的方法。

为什么要将 arXiv 论文保存为 Markdown?

处理 arXiv 论文存在摩擦:

  • PDF 难以搜索 — 无法跨保存的论文进行全文搜索
  • 摘要缺乏细节 — 但下载每篇 PDF 又难以应对
  • 没有整理功能 — arXiv 没有文件夹、标签或个人库
  • AI 工具难以处理 PDF — Markdown 对 AI 来说容易得多

Save 从 arXiv 捕获的内容

摘要页面

  • 论文标题和作者
  • 完整摘要
  • 类别和学科
  • 提交日期
  • PDF 和 HTML 版本的链接

HTML 论文(arXiv HTML5)

arXiv 现在为许多论文提供 HTML 版本。Save 捕获:

  • 带章节结构的完整论文文本
  • 方程式和数学符号
  • 表格和图形(引用形式)
  • 参考文献和引用
  • 定理和证明块

示例输出(摘要页面)

# Attention Is All You Need

**作者:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**提交日期:** 2017 年 6 月 12 日
**类别:** cs.CL, cs.LG

---

## 摘要

主流序列转导模型基于复杂的循环或卷积神经网络……

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

使用场景

文献综述

  • 将摘要和关键论文保存为 Markdown
  • 在 Obsidian 中构建可搜索的文献数据库
  • 使用 Dataview 查询按主题、年份或状态追踪论文
  • 通过维基链接交叉引用论文

研究追踪

  • 随着你所在领域论文发布时保存它们
  • 使用 frontmatter 状态标签构建阅读队列
  • 追踪哪些论文你已经读过、引用过或需要重新访问

AI 辅助研究

  • 将保存的论文提供给 AI 进行摘要和解释
  • 要求 AI 比较多篇论文的方法
  • 从你的 Markdown 收藏生成文献综述草稿

最佳实践技巧

  1. 尽可能保存 HTML 版本 — 在 arXiv 页面点击「HTML」获取完整论文内容
  2. 摘要页面用于快速捕获 — 当你只需要元数据和摘要时保存摘要页面
  3. 添加 frontmatter — 保存后添加标签、状态和评分,以便更好地组织
  4. 批量保存 — 审阅会议论文集时,在一次会话中保存多篇论文

在 Obsidian 中整理论文

保存后添加 frontmatter:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

然后用 Dataview 查询:

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

开始使用

从 Chrome 网上应用店安装 Save — 建立你的研究库。


有问题?请联系 [email protected]