Sådan konverterer du arXiv-artikler til Markdown til AI-forskning
arXiv-artikler er PDFs. PDFs er frygtelige til AI-workflows. De søger ikke godt, de spilder tokens, når de fodres til LLM’er, og de kan ikke let kombineres med andet forskningsmateriale i en vidensbase.
Hvis du driver AI-forskning — eller ethvert felt der afhænger af arXiv — ændrer konvertering af artikler til Markdown alt.
Hvorfor Markdown til forskningsartikler?
LLM’er forstår Markdown nativt. Fod Claude eller ChatGPT en PDF, og den kæmper med formatering, sideskift og to-spalter-layouts. Fod den Markdown, og den læser perfekt — hver ligning, hver kodeblok, hver reference.
10x færre tokens. En typisk arXiv-artikel er 200-500KB som PDF. Det samme indhold i Markdown er 10-30KB. Det betyder, at du kan passe 10x flere artikler i et enkelt Claude-kontekstvindue.
Søgbart på tværs af dit hele bibliotek. Med 50 artikler som Markdown-filer i en mappe kan du grep efter ethvert koncept på tværs af dem alle på millisekunder. Prøv det med PDFs.
Fungerer med Obsidian. Artikler som Markdown-filer i Obsidian bliver linkede, taggede og søgbare. Tilføj dine egne noter inline. Skab forbindelser mellem artikler med [[wikilinks]].
Sådan gemmer du arXiv-artikler som Markdown
Metode 1: Save-udvidelsen (Anbefalet)
Save konverterer arXiv-abstrakt-siden (og mange HTML-renderede artikler) til ren Markdown.
- Åbn arXiv-artikkelsiden (f.eks.
arxiv.org/abs/2401.12345) - Klik på Save-udvidelsesikonet
- Få en Markdown-fil med titel, forfattere, abstrakt og tilgængeligt indhold
Til artikler med HTML-versioner (stadig mere almindelige på arXiv) udtrækker Save det fulde artikelindhold inklusive ligninger, figurreferencer og citationer.
Metode 2: arXiv HTML + Save
Mange nyere artikler har en HTML-version på arXiv (kig efter “HTML”-linket ved siden af PDF). Åbn HTML-versionen og brug Save — du får hele artiklen som ren Markdown.
Metode 3: Semantic Scholar eller Papers With Code
Disse sites har ofte renere HTML-gengivelser af artikler. Åbn artikkelsiden og brug Save.
Opbygning af en forskningsvidensbase
Den virkelige kraft kommer fra akkumulering af artikler over tid:
research/
attention/
attention-is-all-you-need.md
flash-attention-v2.md
multi-head-latent-attention.md
scaling/
chinchilla-scaling-laws.md
scaling-data-constrained.md
agents/
toolformer.md
react-prompting.md
mcp-protocol.md
Peg Claude Code på denne mappe:
cd research
claude
Nu kan du spørge: “Sammenlign opmærksomhedsmekanismerne i disse artikler” eller “Hvad er nøgleresultaterne om skaleringsregler?” Claude læser alle dine artikler og syntetiserer svar forankret i faktisk forskning.
Karpathy-mønsteret
Andrej Karpathy beskrev denne tilgang: byg en personlig wiki af markdown-filer, lad et LLM researche på tværs af dem. For AI-forskere betyder dette:
- Gem alle vigtige artikler som Markdown
- Organiser efter emne
- Tilføj dine egne noter og annotationer
- Lad Claude eller ChatGPT arbejde med hele samlingen
Efter et par måneder har du en personlig forskningsassistent, der kender alle artikler, du har læst.
Kom i gang
Installer Save og start med den næste arXiv-artikel, du læser. Over tid vokser dit Markdown-forskningsbibliotek til noget, ingen generisk AI kan matche.
Gør arXiv-artikler til en søgbar, AI-læsbar vidensbase. Installer Save — gratis at starte.