← Tillbaka till bloggen

Hur du Konverterar arXiv-artiklar till Markdown för AI-forskning

· Save Team
arxivresearchacademicaimarkdown

arXiv-artiklar är PDF:er. PDF:er är hemska för AI-arbetsflöden. De söker inte bra, slösar tokens när de matas till LLM:er, och kan inte enkelt kombineras med annat forskningsmaterial i en kunskapsbas.

Om du forskar inom AI — eller inom vilket område som helst som förlitar sig på arXiv — förändrar konvertering av artiklar till Markdown allt.

Varför Markdown för Forskningsartiklar?

LLM:er förstår Markdown naturligt. Mata Claude eller ChatGPT en PDF och den kämpar med formatering, sidbrytningar och tvåkolumnslayouter. Mata den Markdown och den läser perfekt — varje ekvation, varje kodblock, varje referens.

10x färre tokens. En typisk arXiv-artikel är 200-500KB som PDF. Samma innehåll i Markdown är 10-30KB. Det betyder att du kan rymma 10x fler artiklar i ett enda Claude-kontextfönster.

Sökbart i hela ditt bibliotek. Med 50 artiklar som Markdown-filer i en mapp kan du söka efter vilket begrepp som helst i alla på millisekunder. Försök det med PDF:er.

Fungerar med Obsidian. Artiklar som Markdown-filer i Obsidian blir länkade, taggade och sökbara. Lägg till dina egna anteckningar inline. Skapa kopplingar mellan artiklar med [[wikilinks]].

Hur du Sparar arXiv-artiklar som Markdown

Metod 1: Save-tillägget (Rekommenderat)

Save konverterar arXiv-abstraktsidan (och många HTML-renderade artiklar) till ren Markdown.

  1. Öppna arXiv-artikelsidan (t.ex. arxiv.org/abs/2401.12345)
  2. Klicka på Save-tilläggets ikon
  3. Få en Markdown-fil med titeln, författarna, abstraktet och tillgängligt innehåll

För artiklar med HTML-versioner (allt vanligare på arXiv) extraherar Save det fullständiga artikelinnehållet inklusive ekvationer, figurreferenser och citeringar.

Metod 2: arXiv HTML + Save

Många nyare artiklar har en HTML-version på arXiv (leta efter “HTML”-länken bredvid PDF:en). Öppna HTML-versionen och använd Save — du får hela artikeln som ren Markdown.

Metod 3: Semantic Scholar eller Papers With Code

Dessa webbplatser har ofta renare HTML-renderingar av artiklar. Öppna artikelsidan och använd Save.

Bygga en Forskningskunskapsbas

Den verkliga kraften kommer av att samla artiklar med tiden:

research/
  attention/
    attention-is-all-you-need.md
    flash-attention-v2.md
    multi-head-latent-attention.md
  scaling/
    chinchilla-scaling-laws.md
    scaling-data-constrained.md
  agents/
    toolformer.md
    react-prompting.md
    mcp-protocol.md

Peka Claude Code mot denna mapp:

cd research
claude

Nu kan du fråga: “Jämför uppmärksamhetsmekanismerna i dessa artiklar” eller “Vad är de viktigaste resultaten om skalningslagar?” Claude läser alla dina artiklar och syntetiserar svar grundade i faktisk forskning.

Karpathy-mönstret

Andrej Karpathy beskrev detta tillvägagångssätt: bygg en personlig wiki av markdown-filer, låt ett LLM forska igenom dem. För AI-forskare betyder detta:

  1. Spara varje viktig artikel som Markdown
  2. Organisera efter ämne
  3. Lägg till dina egna anteckningar och kommentarer
  4. Låt Claude eller ChatGPT arbeta med hela samlingen

Efter några månader har du en personlig forskningsassistent som känner till varje artikel du har läst.

Komma Igång

Installera Save och börja med nästa arXiv-artikel du läser. Med tiden sammansätts ditt Markdown-forskningsbibliotek till något som ingen generisk AI kan matcha.


Förvandla arXiv-artiklar till en sökbar, AI-läsbar kunskapsbas. Installera Save — gratis att börja.