← Retour au blog

Comment enregistrer des articles arXiv en Markdown

· Save Team
arxivresearchacademicpapers

arXiv est la premiere destination pour la recherche de pointe en IA, physique, mathematiques et informatique. Mais les articles de recherche sont denses, et l’interface d’arXiv ne facilite pas l’enregistrement et l’organisation des articles que vous suivez. Voici comment capturer le contenu arXiv en Markdown propre.

Pourquoi enregistrer des articles arXiv en Markdown ?

Travailler avec les articles arXiv cree des frictions :

  • Les PDF sont difficiles a chercher --- pas de recherche plein texte dans vos articles enregistres
  • Les resumes manquent de detail --- mais telecharger chaque PDF est ecrasant
  • Pas d’organisation --- arXiv n’a pas de dossiers, tags ou bibliotheque personnelle
  • Les outils IA peinent avec les PDF --- le Markdown est bien plus facile a traiter pour l’IA

Ce que Save capture depuis arXiv

Pages de resume

  • Titre et auteurs de l’article
  • Resume complet
  • Categories et sujets
  • Dates de soumission
  • Liens vers les versions PDF et HTML

Articles HTML (arXiv HTML5)

arXiv propose desormais des versions HTML de nombreux articles. Save capture :

  • Texte complet avec structure des sections
  • Equations et notation mathematique
  • Tableaux et figures (references)
  • References et citations
  • Blocs de theoremes et demonstrations

Exemple de resultat (page de resume)

# Attention Is All You Need

**Authors:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**Submitted:** June 12, 2017
**Categories:** cs.CL, cs.LG

---

## Abstract

The dominant sequence transduction models are based on complex
recurrent or convolutional neural networks that include an encoder
and a decoder. The best performing models also connect the encoder
and decoder through an attention mechanism. We propose a new simple
network architecture, the Transformer, based solely on attention
mechanisms, dispensing with recurrence and convolutions entirely...

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

Cas d’utilisation

Revues de litterature

  • Enregistrez resumes et articles cles en Markdown
  • Construisez une base de donnees de litterature consultable dans Obsidian
  • Utilisez des requetes Dataview pour suivre les articles par sujet, annee ou statut
  • Etablissez des references croisees entre articles via les wikilinks

Suivi de la recherche

  • Enregistrez les articles au fur et a mesure de leur publication dans votre domaine
  • Construisez une file de lecture avec des tags de statut en frontmatter
  • Suivez les articles lus, cites ou a revoir

Recherche assistee par IA

  • Alimentez l’IA avec des articles enregistres pour des resumes et explications
  • Demandez a l’IA de comparer les methodes de plusieurs articles
  • Generez des brouillons de revue de litterature a partir de votre collection Markdown

Groupes d’etude

  • Enregistrez et partagez des resumes d’articles avec votre groupe de recherche
  • Le format Markdown standard convient a tout le monde
  • Ajoutez vos propres notes et questions a chaque article

Conseils pour de meilleurs resultats

  1. Enregistrez la version HTML quand disponible --- cliquez “HTML” sur la page arXiv pour le contenu complet
  2. Pages de resume pour une capture rapide --- enregistrez la page de resume quand vous n’avez besoin que des metadonnees et du resume
  3. Ajoutez du frontmatter --- ajoutez des tags, statut et note apres enregistrement pour une meilleure organisation
  4. Enregistrement par lot --- lors de la revue des actes d’une conference, enregistrez plusieurs articles en une session

Organiser des articles dans Obsidian

Ajoutez du frontmatter apres enregistrement :

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

Puis interrogez avec Dataview :

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

Commencer

Installez Save depuis le Chrome Web Store --- construisez votre bibliotheque de recherche.


Des questions ? Ecrivez-nous a [email protected]