Slik Konverterer Du arXiv-artikler til Markdown for AI-forskning
arXiv-artikler er PDF-er. PDF-er er forferdelige for AI-arbeidsflyter. De søker ikke godt, de kaster bort tokens når de mates til LLM-er, og de kan ikke enkelt kombineres med annet forskningsmateriale i en kunnskapsbase.
Hvis du driver med AI-forskning --- eller noe felt som er avhengig av arXiv --- endrer konvertering av artikler til Markdown alt.
Hvorfor Markdown for Forskningsartikler?
LLM-er forstår Markdown naturlig. Gi Claude eller ChatGPT en PDF og den sliter med formatering, sideskift og to-kolonne oppsett. Gi den Markdown og den leser perfekt --- hver ligning, hver kodeblokk, hver referanse.
10x færre tokens. En typisk arXiv-artikkel er 200-500KB som PDF. Det samme innholdet i Markdown er 10-30KB. Det betyr at du kan passe 10x flere artikler i et enkelt Claude kontekstvindu.
Søkbart på tvers av hele biblioteket ditt. Med 50 artikler som Markdown-filer i en mappe kan du grep etter ethvert konsept på tvers av alle dem på millisekunder. Prøv det med PDF-er.
Fungerer med Obsidian. Artikler som Markdown-filer i Obsidian blir lenkede, merkede og søkbare. Legg til dine egne notater innebygd. Lag forbindelser mellom artikler med [[wikilinks]].
Slik Lagrer Du arXiv-artikler som Markdown
Metode 1: Save-utvidelsen (Anbefalt)
Save konverterer arXiv abstrakt-siden (og mange HTML-renderte artikler) til ren Markdown.
- Åpne arXiv-artikkelsiden (f.eks.
arxiv.org/abs/2401.12345) - Klikk på Save-utvidelsesikonet
- Få en Markdown-fil med tittelen, forfatterne, abstraktet og tilgjengelig innhold
For artikler med HTML-versjoner (stadig vanligere på arXiv), trekker Save ut fullstendig artikkelinnhold inkludert ligninger, figurreferanser og sitater.
Metode 2: arXiv HTML + Save
Mange nyere artikler har en HTML-versjon på arXiv (se etter “HTML”-lenken ved siden av PDF). Åpne HTML-versjonen og bruk Save --- du får hele artikkelen som ren Markdown.
Metode 3: Semantic Scholar eller Papers With Code
Disse nettstedene har ofte renere HTML-gjengivelser av artikler. Åpne artikkelsiden og bruk Save.
Bygge en Forskningskunnskapsbase
Den virkelige kraften kommer fra å samle artikler over tid:
research/
attention/
attention-is-all-you-need.md
flash-attention-v2.md
multi-head-latent-attention.md
scaling/
chinchilla-scaling-laws.md
scaling-data-constrained.md
agents/
toolformer.md
react-prompting.md
mcp-protocol.md
Pek Claude Code på denne mappen:
cd research
claude
Nå kan du spørre: “Sammenlign oppmerksomhetsmekanismene i disse artiklene” eller “Hva er de viktigste funnene om skaleringslov?” Claude leser alle artiklene dine og syntetiserer svar forankret i faktisk forskning.
Karpathy-mønsteret
Andrej Karpathy beskrev denne tilnærmingen: bygg en personlig wiki av markdown-filer, la en LLM forske på tvers av dem. For AI-forskere betyr dette:
- Lagre alle viktige artikler som Markdown
- Organiser etter emne
- Legg til egne notater og kommentarer
- La Claude eller ChatGPT jobbe med hele samlingen
Etter noen måneder har du en personlig forskningsassistent som kjenner alle artiklene du har lest.
Kom i Gang
Installer Save og start med den neste arXiv-artikkelen du leser. Over tid bygges Markdown-forskningsbiblioteket ditt opp til noe ingen generisk AI kan matche.
Gjør arXiv-artikler til en søkbar, AI-lesbar kunnskapsbase. Installer Save --- gratis å starte.