arXivの論文をMarkdownとして保存する方法

arXivはAI、物理学、数学、計算機科学の最先端研究の第一の情報源です。しかし、研究論文は内容が濃く、arXivのインターフェースでは追跡中の論文を保存・整理するのが容易ではありません。ここでは、arXivのコンテンツをクリーンなMarkdownとしてキャプチャする方法を紹介します。

arXivの論文をMarkdownで保存すべき理由

arXiv論文を扱うには摩擦があります：

PDFは検索しにくい --- 保存した論文をまたいだ全文検索ができない
アブストラクトだけでは不十分 --- しかしすべてのPDFをダウンロードするのは圧倒的
整理の手段がない --- arXivにはフォルダ、タグ、個人ライブラリがない
AIツールはPDFが苦手 --- MarkdownのほうがAIによる処理がはるかに容易

SaveがarXivからキャプチャする内容

アブストラクトページ

論文タイトルと著者
完全なアブストラクト
カテゴリとサブジェクト
投稿日
PDFおよびHTML版へのリンク

HTML論文（arXiv HTML5）

arXivは現在、多くの論文のHTML版を提供しています。Saveがキャプチャする内容：

セクション構造を含む論文全文
数式と数学的表記
テーブルと図（参照として）
参考文献と引用
定理と証明のブロック

出力例（アブストラクトページ）

# Attention Is All You Need

**Authors:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**Submitted:** June 12, 2017
**Categories:** cs.CL, cs.LG

---

## Abstract

The dominant sequence transduction models are based on complex
recurrent or convolutional neural networks that include an encoder
and a decoder. The best performing models also connect the encoder
and decoder through an attention mechanism. We propose a new simple
network architecture, the Transformer, based solely on attention
mechanisms, dispensing with recurrence and convolutions entirely...

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

ユースケース

文献レビュー

アブストラクトと主要論文をMarkdownとして保存
Obsidianに検索可能な文献データベースを構築
Dataviewクエリでトピック、年、ステータス別に論文を追跡
Wikiリンクで論文間を相互参照

リサーチの追跡

自分の分野で公開される論文をリアルタイムで保存
フロントマターのステータスタグ付きで読書キューを構築
読了済み、引用済み、再読が必要な論文を追跡

AI支援リサーチ

保存した論文をAIに提供して要約や解説を依頼
複数の論文間で手法をAIに比較させる
Markdownコレクションから文献レビューの下書きを生成

勉強会

研究グループと論文サマリーを保存・共有
標準化されたMarkdown形式で全員が使える
各論文に自分のメモや質問を追加

より良い結果を得るためのヒント

利用可能な場合はHTML版を保存 --- arXivページの「HTML」をクリックして論文全文を取得
アブストラクトページで素早くキャプチャ --- メタデータとサマリーだけ必要な場合はアブストラクトページを保存
フロントマターを追加 --- 保存後にタグ、ステータス、評価を追加して整理を向上
バッチ保存 --- 学会のプロシーディングスを確認する際は、1セッションで複数の論文を保存

Obsidianでの論文整理

保存後にフロントマターを追加：

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

次にDataviewでクエリ：

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

はじめよう

Chrome Web StoreからSaveをインストール --- 研究ライブラリを構築しましょう。

ご質問は [email protected] まで

arXivの論文をMarkdownとして保存する方法

arXivの論文をMarkdownで保存すべき理由

SaveがarXivからキャプチャする内容

アブストラクトページ

HTML論文（arXiv HTML5）

出力例（アブストラクトページ）

ユースケース

文献レビュー

リサーチの追跡

AI支援リサーチ

勉強会

より良い結果を得るためのヒント

Obsidianでの論文整理

はじめよう

## Continue reading

AIリサーチのためにarXiv論文をMarkdownに変換する方法

ワンクリックで学術論文をアカデミック形式で保存

Markdownを使った究極の学術リサーチワークフロー

研究論文をクリーンなMarkdownとしてObsidianに保存する方法

Jean-Sébastien Wallez