← Volver al blog

Cómo guardar cualquier página web como Markdown (3 métodos)

· Save Team
markdownweb-clipperhow-toproductivity

Quieres guardar una página web como archivo Markdown. Quizás estás construyendo una base de conocimiento, archivando documentación, o simplemente quieres una copia limpia de un artículo. Aquí hay tres formas de hacerlo, de la más simple a la más técnica.

Método 1: la extensión Save (la más fácil)

Save es una extensión de Chrome que convierte cualquier página web en Markdown limpio con un solo clic.

Cómo funciona:

  1. Instala Save desde la Chrome Web Store
  2. Visita cualquier página web
  3. Haz clic en el icono de Save
  4. Un archivo .md se descarga en tu ordenador

Por qué es buena:

  • La extracción con IA elimina anuncios, navegación y ruido
  • Preserva encabezados, listas, bloques de código, tablas y enlaces
  • Funciona en páginas difíciles: YouTube (transcripciones completas), hilos de Twitter, Reddit, Confluence, contenido de pago
  • Sin terminal, sin claves API, sin configuración
  • La salida es Markdown limpio y estructurado, listo para Obsidian, VS Code o herramientas de IA

Ideal para: Cualquier persona que quiera Markdown limpio sin tocar un terminal.

Método 2: herramientas de línea de comandos

Varias herramientas CLI convierten HTML a Markdown:

Pandoc

La navaja suiza de la conversión de documentos:

# Desde una URL (obtener + convertir)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md

# Desde un archivo HTML local
pandoc input.html -o output.md

Ventajas: Potente, maneja documentos complejos, muchos formatos de salida. Desventajas: Obtiene HTML en bruto (incluye navegación, anuncios, scripts). La salida frecuentemente necesita limpieza manual.

Defuddle

Una herramienta más reciente enfocada en extraer contenido legible:

npm install -g defuddle
defuddle parse https://example.com/article --md

Ventajas: Elimina navegación y ruido, se centra en el contenido del artículo. Desventajas: Requiere Node.js, no maneja todos los tipos de páginas.

Jina Reader

Una API alojada que devuelve Markdown:

curl -s "https://r.jina.ai/https://example.com/article"

Ventajas: Sin instalación, funciona vía HTTP. Desventajas: Con límite de velocidad, requiere internet, dependencia de terceros, maneja mal las páginas renderizadas con JavaScript.

Ideal para: Desarrolladores que se sienten cómodos en el terminal y necesitan convertir páginas en lote.

Método 3: copiar y pegar manualmente

El enfoque de baja tecnología:

  1. Selecciona todo el contenido de la página (Cmd+A o Ctrl+A)
  2. Cópialo (Cmd+C o Ctrl+C)
  3. Pégalo en un editor Markdown
  4. Corrige el formato manualmente

Ventajas: No se necesitan herramientas. Desventajas: Copia todo (navegación, anuncios, pies de página). Pierde el formato. Las tablas se rompen. Los bloques de código desaparecen. Los enlaces se convierten en texto plano. Lleva tiempo para cualquier cosa más allá de un artículo corto.

Ideal para: Guardados ocasionales cuando solo necesitas unos pocos párrafos.

Comparación

CaracterísticaExtensión SaveHerramientas CLICopiar y pegar
Tiempo de configuración10 segundos5-30 minutosNinguno
Guardado con un clicNoNo
Salida limpiaExtraída por IAVariableLimpieza manual
Transcripciones de YouTubeNoNo
Hilos de TwitterNoParcial
Confluence/wikisParcialDesordenado
Bloques de código preservadosGeneralmenteNo
Tablas preservadasGeneralmenteNo
Funciona sin conexiónNoSí (Pandoc)
CosteNivel gratuito disponibleGratisGratis

¿Por qué guardar páginas web como Markdown?

Si estás leyendo esto, probablemente ya sabes por qué. Pero aquí está la razón por la que Markdown supera a todos los demás formatos para guardar contenido web:

Es pequeño. Un artículo típico es 5 KB en Markdown frente a más de 100 KB en HTML. Eso es 20 veces menos almacenamiento y 20 veces menos tokens si lo envías a una IA.

Es portable. Ábrelo en cualquier editor de texto, cualquier app de notas (Obsidian, Notion, Logseq), o cualquier herramienta de desarrollador. Sin bloqueo de proveedor.

Es buscable. Busca en cientos de archivos Markdown con grep en milisegundos. Intenta eso con PDFs.

Los LLM lo adoran. Claude, ChatGPT y otras herramientas de IA fueron entrenados en millones de documentos Markdown. Darles Markdown produce mejores resultados que HTML en bruto o PDF.

Dura para siempre. Los archivos de texto plano son el formato digital más duradero. Tus archivos .md serán legibles en 50 años. Tus marcadores no sobrevivirán 5.

Empezar

La forma más rápida de empezar a guardar páginas web como Markdown: instala Save desde la Chrome Web Store. Es gratis para empezar y tarda 10 segundos en instalarse.


No vuelvas a perder una página web. Save convierte cualquier página a Markdown limpio con un clic.