← Volver al blog

Como guardar articulos de arXiv como Markdown

· Save Team
arxivresearchacademicpapers

arXiv es la primera parada para investigacion de vanguardia en IA, fisica, matematicas e informatica. Pero los articulos de investigacion son densos, y la interfaz de arXiv no facilita guardar y organizar los papers que estas siguiendo. Asi es como puedes capturar contenido de arXiv como Markdown limpio.

Por que guardar articulos de arXiv como Markdown?

Trabajar con articulos de arXiv tiene friccion:

  • Los PDFs son dificiles de buscar --- no hay busqueda de texto completo en tus papers guardados
  • Los resumenes carecen de detalle --- pero descargar cada PDF es abrumador
  • Sin organizacion --- arXiv no tiene carpetas, etiquetas ni biblioteca personal
  • Las herramientas de IA tienen problemas con PDFs --- el Markdown es mucho mas facil de procesar para la IA

Que captura Save de arXiv

Paginas de resumenes

  • Titulo del articulo y autores
  • Resumen completo
  • Categorias y temas
  • Fechas de envio
  • Links a versiones PDF y HTML

Articulos HTML (arXiv HTML5)

arXiv ahora ofrece versiones HTML de muchos articulos. Save captura:

  • Texto completo del articulo con estructura de secciones
  • Ecuaciones y notacion matematica
  • Tablas y figuras (referenciadas)
  • Referencias y citas
  • Bloques de teoremas y demostraciones

Ejemplo de salida (pagina de resumen)

# Attention Is All You Need

**Authors:** Ashish Vaswani, Noam Shazeer, Niki Parmar,
Jakob Uszkoreit, Llion Jones, Aidan N. Gomez,
Lukasz Kaiser, Illia Polosukhin

**Submitted:** June 12, 2017
**Categories:** cs.CL, cs.LG

---

## Abstract

The dominant sequence transduction models are based on complex
recurrent or convolutional neural networks that include an encoder
and a decoder. The best performing models also connect the encoder
and decoder through an attention mechanism. We propose a new simple
network architecture, the Transformer, based solely on attention
mechanisms, dispensing with recurrence and convolutions entirely...

**PDF:** https://arxiv.org/pdf/1706.03762
**HTML:** https://arxiv.org/html/1706.03762

Casos de uso

Revisiones de literatura

  • Guarda resumenes y articulos clave como Markdown
  • Construye una base de datos de literatura con busqueda en Obsidian
  • Usa consultas Dataview para rastrear articulos por tema, ano o estado
  • Referencia cruzada de articulos a traves de wikilinks

Seguimiento de investigacion

  • Guarda articulos a medida que se publican en tu campo
  • Construye una cola de lectura con etiquetas de estado en el frontmatter
  • Rastrea que articulos has leido, citado o necesitas revisar

Investigacion asistida por IA

  • Alimenta articulos guardados a la IA para resumenes y explicaciones
  • Pide a la IA que compare metodos de multiples articulos
  • Genera borradores de revision de literatura a partir de tu coleccion de Markdown

Grupos de estudio

  • Guarda y comparte resumenes de articulos con tu grupo de investigacion
  • El formato Markdown estandarizado funciona para todos
  • Agrega tus propias notas y preguntas a cada articulo

Consejos para mejores resultados

  1. Guarda la version HTML cuando este disponible --- haz clic en “HTML” en la pagina de arXiv para obtener el contenido completo del articulo
  2. Paginas de resumenes para captura rapida --- guarda la pagina de resumen cuando solo necesitas metadatos y un resumen
  3. Agrega frontmatter --- agrega etiquetas, estado y calificacion despues de guardar para mejor organizacion
  4. Guardado por lotes --- cuando revisas las actas de una conferencia, guarda multiples articulos en una sesion

Organizando articulos en Obsidian

Agrega frontmatter despues de guardar:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
arxiv: "1706.03762"
status: read
rating: 5
tags: [transformers, attention, nlp]
---

Luego consulta con Dataview:

TABLE authors, year, rating
FROM "papers"
WHERE contains(tags, "transformers")
SORT year DESC

Empieza ahora

Instala Save desde la Chrome Web Store --- construye tu biblioteca de investigacion.


Tienes preguntas? Escribenos a [email protected]