← Wróć do bloga

Zapisywanie artykułów arXiv jako Markdown

· Save Team
arxivresearchacademicpapers

arXiv to pierwsze miejsce dla przełomowych badań w dziedzinie AI, fizyki, matematyki i informatyki. Jednak artykuły naukowe są gęste, a interfejs arXiv nie ułatwia zapisywania i organizowania śledzonych artykułów. Oto jak przechwytywać treści arXiv jako czysty Markdown.

Dlaczego zapisywać artykuły arXiv jako Markdown?

Praca z artykułami arXiv wiąże się z trudnościami:

  • PDF-y są trudne do przeszukiwania — brak pełnotekstowego wyszukiwania wśród zapisanych artykułów
  • Abstrakty brakuje szczegółów — ale pobieranie każdego PDF jest przytłaczające
  • Brak organizacji — arXiv nie ma folderów, tagów ani osobistej biblioteki
  • Narzędzia AI mają trudności z PDF-ami — Markdown jest znacznie łatwiejszy do przetworzenia przez AI

Co Save przechwytuje z arXiv

Strony abstraktów

  • Tytuł artykułu i autorzy
  • Pełny abstrakt
  • Kategorie i tematy
  • Daty zgłoszenia
  • Linki do wersji PDF i HTML

Artykuły HTML (arXiv HTML5)

arXiv oferuje teraz wersje HTML wielu artykułów. Save przechwytuje:

  • Pełny tekst artykułu ze strukturą sekcji
  • Równania i notację matematyczną
  • Tabele i rysunki (z odniesieniami)
  • Referencje i cytaty
  • Bloki twierdzeń i dowodów

Przykładowy wynik (strona abstraktu)

# Attention Is All You Need

**Autorzy:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**Zgłoszono:** 12 czerwca 2017
**Kategorie:** cs.CL, cs.LG

---

## Abstrakt

Dominujące modele sekwencyjnej transdukcji opierają się na złożonych
rekurencyjnych lub splotowych sieciach neuronowych zawierających
koder i dekoder...

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

Przypadki użycia

Przeglądy literatury

  • Zapisuj abstrakty i kluczowe artykuły jako Markdown
  • Buduj przeszukiwalną bazę literatury w Obsidian
  • Używaj zapytań Dataview do śledzenia artykułów według tematu, roku lub statusu
  • Krzyżowe odwoływanie się do artykułów przez wikilinkowania

Śledzenie badań

  • Zapisuj artykuły w miarę ich publikowania w swojej dziedzinie
  • Buduj kolejkę czytania z tagami statusu w frontmatter
  • Śledź, które artykuły przeczytałeś, zacytowałeś lub musisz jeszcze sprawdzić

Badania wspomagane przez AI

  • Przekazuj zapisane artykuły do AI po podsumowania i wyjaśnienia
  • Proś AI o porównanie metod w różnych artykułach
  • Generuj szkice przeglądów literatury ze swojej kolekcji Markdown

Grupy badawcze

  • Zapisuj i udostępniaj podsumowania artykułów swojej grupie badawczej
  • Ustandaryzowany format Markdown działa dla wszystkich
  • Dodawaj własne notatki i pytania do każdego artykułu

Wskazówki dla najlepszych wyników

  1. Zapisuj wersję HTML, gdy jest dostępna — kliknij “HTML” na stronie arXiv, aby uzyskać pełną treść artykułu
  2. Strony abstraktów do szybkiego przechwytywania — zapisuj stronę abstraktu, gdy potrzebujesz tylko metadanych i podsumowania
  3. Dodaj frontmatter — po zapisaniu dodaj tagi, status i ocenę dla lepszej organizacji
  4. Zbiorcze zapisywanie — przeglądając materiały konferencyjne, zapisuj wiele artykułów w jednej sesji

Organizowanie artykułów w Obsidian

Dodaj frontmatter po zapisaniu:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: przeczytane
rating: 5
tags: [transformers, attention, nlp]
---

Następnie zapytaj z Dataview:

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

Zacznij

Zainstaluj Save ze sklepu Chrome Web Store — zbuduj swoją bibliotekę badań.


Masz pytania? Skontaktuj się z nami pod adresem [email protected]