Как сохранять статьи arXiv в формате Markdown
· Save Team
arxivresearchacademicpapers
arXiv — первая остановка для передовых исследований в AI, физике, математике и информатике. Но исследовательские статьи плотные, и интерфейс arXiv не облегчает сохранение и организацию статей. Вот как захватить контент arXiv в виде чистого Markdown.
Зачем сохранять статьи arXiv как Markdown?
- PDF сложно искать — нет полнотекстового поиска по сохранённым статьям
- Аннотации не дают деталей — но скачивать каждый PDF обременительно
- Нет организации — у arXiv нет папок, тегов или личной библиотеки
- AI плохо работает с PDF — Markdown обрабатывается гораздо легче
Что Save захватывает с arXiv
Страницы аннотаций
- Заголовок статьи и авторы, полная аннотация, категории, даты, ссылки на PDF и HTML
HTML-статьи (arXiv HTML5)
arXiv теперь предлагает HTML-версии многих статей. Save захватывает полный текст с структурой разделов, уравнения, таблицы, ссылки.
Сценарии использования
Обзоры литературы
- Сохраняйте аннотации и ключевые статьи как Markdown
- Создавайте поисковую базу литературы в Obsidian
- Используйте запросы Dataview для отслеживания по теме, году или статусу
AI-ассистированные исследования
- Подавайте сохранённые статьи в AI для резюме и объяснений
- Просите AI сравнивать методы из нескольких статей
Советы для лучших результатов
- Сохраняйте HTML-версию — нажмите «HTML» на странице arXiv для полного текста
- Добавляйте frontmatter — добавляйте теги, статус и рейтинг после сохранения
- Сохраняйте пакетами — при просмотре трудов конференции сохраняйте несколько статей за раз
Организация статей в Obsidian
Добавьте frontmatter после сохранения:
---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---
Начало работы
Установите Save из Chrome Web Store — создавайте свою исследовательскую библиотеку.
Есть вопросы? Пишите на [email protected]