arXiv — первая остановка для передовых исследований в AI, физике, математике и информатике. Но исследовательские статьи плотные, и интерфейс arXiv не облегчает сохранение и организацию статей. Вот как захватить контент arXiv в виде чистого Markdown.

Зачем сохранять статьи arXiv как Markdown?

PDF сложно искать — нет полнотекстового поиска по сохранённым статьям
Аннотации не дают деталей — но скачивать каждый PDF обременительно
Нет организации — у arXiv нет папок, тегов или личной библиотеки
AI плохо работает с PDF — Markdown обрабатывается гораздо легче

Что Save захватывает с arXiv

Страницы аннотаций

Заголовок статьи и авторы, полная аннотация, категории, даты, ссылки на PDF и HTML

HTML-статьи (arXiv HTML5)

arXiv теперь предлагает HTML-версии многих статей. Save захватывает полный текст с структурой разделов, уравнения, таблицы, ссылки.

Сценарии использования

Обзоры литературы

Сохраняйте аннотации и ключевые статьи как Markdown
Создавайте поисковую базу литературы в Obsidian
Используйте запросы Dataview для отслеживания по теме, году или статусу

AI-ассистированные исследования

Подавайте сохранённые статьи в AI для резюме и объяснений
Просите AI сравнивать методы из нескольких статей

Советы для лучших результатов

Сохраняйте HTML-версию — нажмите «HTML» на странице arXiv для полного текста
Добавляйте frontmatter — добавляйте теги, статус и рейтинг после сохранения
Сохраняйте пакетами — при просмотре трудов конференции сохраняйте несколько статей за раз

Организация статей в Obsidian

Добавьте frontmatter после сохранения:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

Начало работы

Установите Save из Chrome Web Store — создавайте свою исследовательскую библиотеку.

Есть вопросы? Пишите на [email protected]