← Zurück zum Blog

arXiv-Paper als Markdown speichern

· Save Team
arxivresearchacademicpapers

arXiv ist die erste Anlaufstelle fuer aktuelle Forschung in KI, Physik, Mathematik und Informatik. Aber Forschungsarbeiten sind dicht, und arXivs Oberflaeche macht es nicht einfach, die Paper zu speichern und zu organisieren, die du verfolgst. So erfasst du arXiv-Inhalte als sauberes Markdown.

Warum arXiv-Paper als Markdown speichern?

Die Arbeit mit arXiv-Papern hat Reibungspunkte:

  • PDFs sind schwer durchsuchbar --- keine Volltextsuche ueber gespeicherte Paper
  • Abstracts fehlt Detail --- aber jedes PDF herunterzuladen ist ueberfordernd
  • Keine Organisation --- arXiv hat keine Ordner, Tags oder persoenliche Bibliothek
  • KI-Tools kaempfen mit PDFs --- Markdown ist deutlich einfacher fuer KI zu verarbeiten

Was Save aus arXiv erfasst

Abstract-Seiten

  • Titel und Autoren des Papers
  • Vollstaendiges Abstract
  • Kategorien und Fachgebiete
  • Einreichungsdaten
  • Links zu PDF- und HTML-Versionen

HTML-Paper (arXiv HTML5)

arXiv bietet inzwischen HTML-Versionen vieler Paper an. Save erfasst:

  • Vollstaendigen Papertext mit Abschnittsstruktur
  • Gleichungen und mathematische Notation
  • Tabellen und Abbildungen (referenziert)
  • Referenzen und Zitate
  • Theorem- und Beweisbloecke

Beispielausgabe (Abstract-Seite)

# Attention Is All You Need

**Authors:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**Submitted:** June 12, 2017
**Categories:** cs.CL, cs.LG

---

## Abstract

The dominant sequence transduction models are based on complex
recurrent or convolutional neural networks that include an encoder
and a decoder. The best performing models also connect the encoder
and decoder through an attention mechanism. We propose a new simple
network architecture, the Transformer, based solely on attention
mechanisms, dispensing with recurrence and convolutions entirely...

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

Anwendungsfaelle

Literaturreviews

  • Abstracts und Schluesselpaper als Markdown speichern
  • Eine durchsuchbare Literaturdatenbank in Obsidian aufbauen
  • Dataview-Abfragen nutzen, um Paper nach Thema, Jahr oder Status zu verfolgen
  • Paper durch Wikilinks querverweisen

Forschungsverfolgung

  • Paper speichern, sobald sie in deinem Fachgebiet veroeffentlicht werden
  • Eine Leseliste mit Frontmatter-Status-Tags aufbauen
  • Nachverfolgen, welche Paper du gelesen, zitiert oder nochmal ansehen musst

KI-gestuetzte Forschung

  • Gespeicherte Paper an KI fuer Zusammenfassungen und Erklaerungen fuettern
  • KI bitten, Methoden ueber mehrere Paper hinweg zu vergleichen
  • Literaturreview-Entwuerfe aus deiner Markdown-Sammlung generieren

Lesegruppen

  • Paper-Zusammenfassungen mit deiner Forschungsgruppe speichern und teilen
  • Standardisiertes Markdown-Format funktioniert fuer alle
  • Eigene Notizen und Fragen zu jedem Paper hinzufuegen

Tipps fuer beste Ergebnisse

  1. HTML-Version speichern wenn verfuegbar --- auf “HTML” auf der arXiv-Seite klicken fuer den vollen Paperinhalt
  2. Abstract-Seiten fuer schnelles Erfassen --- die Abstract-Seite speichern, wenn du nur Metadaten und Zusammenfassung brauchst
  3. Frontmatter hinzufuegen --- nach dem Speichern Tags, Status und Bewertung fuer bessere Organisation ergaenzen
  4. Stapelweise speichern --- beim Durchsehen von Konferenz-Proceedings mehrere Paper in einer Sitzung speichern

Paper in Obsidian organisieren

Frontmatter nach dem Speichern ergaenzen:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

Dann mit Dataview abfragen:

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

Loslegen

Save aus dem Chrome Web Store installieren --- bau deine Forschungsbibliothek auf.


Fragen? Schreib an [email protected]