← Tilbake til bloggen

Slik Konverterer Du arXiv-artikler til Markdown for AI-forskning

· Save Team
arxivresearchacademicaimarkdown

arXiv-artikler er PDF-er. PDF-er er forferdelige for AI-arbeidsflyter. De søker ikke godt, de kaster bort tokens når de mates til LLM-er, og de kan ikke enkelt kombineres med annet forskningsmateriale i en kunnskapsbase.

Hvis du driver med AI-forskning --- eller noe felt som er avhengig av arXiv --- endrer konvertering av artikler til Markdown alt.

Hvorfor Markdown for Forskningsartikler?

LLM-er forstår Markdown naturlig. Gi Claude eller ChatGPT en PDF og den sliter med formatering, sideskift og to-kolonne oppsett. Gi den Markdown og den leser perfekt --- hver ligning, hver kodeblokk, hver referanse.

10x færre tokens. En typisk arXiv-artikkel er 200-500KB som PDF. Det samme innholdet i Markdown er 10-30KB. Det betyr at du kan passe 10x flere artikler i et enkelt Claude kontekstvindu.

Søkbart på tvers av hele biblioteket ditt. Med 50 artikler som Markdown-filer i en mappe kan du grep etter ethvert konsept på tvers av alle dem på millisekunder. Prøv det med PDF-er.

Fungerer med Obsidian. Artikler som Markdown-filer i Obsidian blir lenkede, merkede og søkbare. Legg til dine egne notater innebygd. Lag forbindelser mellom artikler med [[wikilinks]].

Slik Lagrer Du arXiv-artikler som Markdown

Metode 1: Save-utvidelsen (Anbefalt)

Save konverterer arXiv abstrakt-siden (og mange HTML-renderte artikler) til ren Markdown.

  1. Åpne arXiv-artikkelsiden (f.eks. arxiv.org/abs/2401.12345)
  2. Klikk på Save-utvidelsesikonet
  3. Få en Markdown-fil med tittelen, forfatterne, abstraktet og tilgjengelig innhold

For artikler med HTML-versjoner (stadig vanligere på arXiv), trekker Save ut fullstendig artikkelinnhold inkludert ligninger, figurreferanser og sitater.

Metode 2: arXiv HTML + Save

Mange nyere artikler har en HTML-versjon på arXiv (se etter “HTML”-lenken ved siden av PDF). Åpne HTML-versjonen og bruk Save --- du får hele artikkelen som ren Markdown.

Metode 3: Semantic Scholar eller Papers With Code

Disse nettstedene har ofte renere HTML-gjengivelser av artikler. Åpne artikkelsiden og bruk Save.

Bygge en Forskningskunnskapsbase

Den virkelige kraften kommer fra å samle artikler over tid:

research/
  attention/
    attention-is-all-you-need.md
    flash-attention-v2.md
    multi-head-latent-attention.md
  scaling/
    chinchilla-scaling-laws.md
    scaling-data-constrained.md
  agents/
    toolformer.md
    react-prompting.md
    mcp-protocol.md

Pek Claude Code på denne mappen:

cd research
claude

Nå kan du spørre: “Sammenlign oppmerksomhetsmekanismene i disse artiklene” eller “Hva er de viktigste funnene om skaleringslov?” Claude leser alle artiklene dine og syntetiserer svar forankret i faktisk forskning.

Karpathy-mønsteret

Andrej Karpathy beskrev denne tilnærmingen: bygg en personlig wiki av markdown-filer, la en LLM forske på tvers av dem. For AI-forskere betyr dette:

  1. Lagre alle viktige artikler som Markdown
  2. Organiser etter emne
  3. Legg til egne notater og kommentarer
  4. La Claude eller ChatGPT jobbe med hele samlingen

Etter noen måneder har du en personlig forskningsassistent som kjenner alle artiklene du har lest.

Kom i Gang

Installer Save og start med den neste arXiv-artikkelen du leser. Over tid bygges Markdown-forskningsbiblioteket ditt opp til noe ingen generisk AI kan matche.


Gjør arXiv-artikler til en søkbar, AI-lesbar kunnskapsbase. Installer Save --- gratis å starte.