← Назад к блогу

Как сохранять статьи arXiv в формате Markdown

· Save Team
arxivresearchacademicpapers

arXiv — первая остановка для передовых исследований в AI, физике, математике и информатике. Но исследовательские статьи плотные, и интерфейс arXiv не облегчает сохранение и организацию статей. Вот как захватить контент arXiv в виде чистого Markdown.

Зачем сохранять статьи arXiv как Markdown?

  • PDF сложно искать — нет полнотекстового поиска по сохранённым статьям
  • Аннотации не дают деталей — но скачивать каждый PDF обременительно
  • Нет организации — у arXiv нет папок, тегов или личной библиотеки
  • AI плохо работает с PDF — Markdown обрабатывается гораздо легче

Что Save захватывает с arXiv

Страницы аннотаций

  • Заголовок статьи и авторы, полная аннотация, категории, даты, ссылки на PDF и HTML

HTML-статьи (arXiv HTML5)

arXiv теперь предлагает HTML-версии многих статей. Save захватывает полный текст с структурой разделов, уравнения, таблицы, ссылки.

Сценарии использования

Обзоры литературы

  • Сохраняйте аннотации и ключевые статьи как Markdown
  • Создавайте поисковую базу литературы в Obsidian
  • Используйте запросы Dataview для отслеживания по теме, году или статусу

AI-ассистированные исследования

  • Подавайте сохранённые статьи в AI для резюме и объяснений
  • Просите AI сравнивать методы из нескольких статей

Советы для лучших результатов

  1. Сохраняйте HTML-версию — нажмите «HTML» на странице arXiv для полного текста
  2. Добавляйте frontmatter — добавляйте теги, статус и рейтинг после сохранения
  3. Сохраняйте пакетами — при просмотре трудов конференции сохраняйте несколько статей за раз

Организация статей в Obsidian

Добавьте frontmatter после сохранения:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

Начало работы

Установите Save из Chrome Web Store — создавайте свою исследовательскую библиотеку.


Есть вопросы? Пишите на [email protected]