← Tilbage til blog

Sådan konverterer du arXiv-artikler til Markdown til AI-forskning

· Save Team
arxivresearchacademicaimarkdown

arXiv-artikler er PDFs. PDFs er frygtelige til AI-workflows. De søger ikke godt, de spilder tokens, når de fodres til LLM’er, og de kan ikke let kombineres med andet forskningsmateriale i en vidensbase.

Hvis du driver AI-forskning — eller ethvert felt der afhænger af arXiv — ændrer konvertering af artikler til Markdown alt.

Hvorfor Markdown til forskningsartikler?

LLM’er forstår Markdown nativt. Fod Claude eller ChatGPT en PDF, og den kæmper med formatering, sideskift og to-spalter-layouts. Fod den Markdown, og den læser perfekt — hver ligning, hver kodeblok, hver reference.

10x færre tokens. En typisk arXiv-artikel er 200-500KB som PDF. Det samme indhold i Markdown er 10-30KB. Det betyder, at du kan passe 10x flere artikler i et enkelt Claude-kontekstvindue.

Søgbart på tværs af dit hele bibliotek. Med 50 artikler som Markdown-filer i en mappe kan du grep efter ethvert koncept på tværs af dem alle på millisekunder. Prøv det med PDFs.

Fungerer med Obsidian. Artikler som Markdown-filer i Obsidian bliver linkede, taggede og søgbare. Tilføj dine egne noter inline. Skab forbindelser mellem artikler med [[wikilinks]].

Sådan gemmer du arXiv-artikler som Markdown

Metode 1: Save-udvidelsen (Anbefalet)

Save konverterer arXiv-abstrakt-siden (og mange HTML-renderede artikler) til ren Markdown.

  1. Åbn arXiv-artikkelsiden (f.eks. arxiv.org/abs/2401.12345)
  2. Klik på Save-udvidelsesikonet
  3. Få en Markdown-fil med titel, forfattere, abstrakt og tilgængeligt indhold

Til artikler med HTML-versioner (stadig mere almindelige på arXiv) udtrækker Save det fulde artikelindhold inklusive ligninger, figurreferencer og citationer.

Metode 2: arXiv HTML + Save

Mange nyere artikler har en HTML-version på arXiv (kig efter “HTML”-linket ved siden af PDF). Åbn HTML-versionen og brug Save — du får hele artiklen som ren Markdown.

Metode 3: Semantic Scholar eller Papers With Code

Disse sites har ofte renere HTML-gengivelser af artikler. Åbn artikkelsiden og brug Save.

Opbygning af en forskningsvidensbase

Den virkelige kraft kommer fra akkumulering af artikler over tid:

research/
  attention/
    attention-is-all-you-need.md
    flash-attention-v2.md
    multi-head-latent-attention.md
  scaling/
    chinchilla-scaling-laws.md
    scaling-data-constrained.md
  agents/
    toolformer.md
    react-prompting.md
    mcp-protocol.md

Peg Claude Code på denne mappe:

cd research
claude

Nu kan du spørge: “Sammenlign opmærksomhedsmekanismerne i disse artikler” eller “Hvad er nøgleresultaterne om skaleringsregler?” Claude læser alle dine artikler og syntetiserer svar forankret i faktisk forskning.

Karpathy-mønsteret

Andrej Karpathy beskrev denne tilgang: byg en personlig wiki af markdown-filer, lad et LLM researche på tværs af dem. For AI-forskere betyder dette:

  1. Gem alle vigtige artikler som Markdown
  2. Organiser efter emne
  3. Tilføj dine egne noter og annotationer
  4. Lad Claude eller ChatGPT arbejde med hele samlingen

Efter et par måneder har du en personlig forskningsassistent, der kender alle artikler, du har læst.

Kom i gang

Installer Save og start med den næste arXiv-artikel, du læser. Over tid vokser dit Markdown-forskningsbibliotek til noget, ingen generisk AI kan matche.


Gør arXiv-artikler til en søgbar, AI-læsbar vidensbase. Installer Save — gratis at starte.