Cómo exportar páginas de Confluence a Markdown (guía 2026)
Confluence no quiere que te vayas. Atlassian almacena tu contenido en un formato XML propietario, no ofrece exportación a Markdown y hace que la extracción masiva sea dolorosa. Si alguna vez has intentado obtener texto limpio de Confluence, conoces la frustración.
Esta guía cubre todos los métodos para exportar páginas de Confluence a Markdown --- desde páginas individuales hasta espacios completos.
¿Por qué exportar Confluence a Markdown?
Los equipos se alejan de Confluence por muchas razones:
- Migrar a una nueva herramienta --- moverse a Notion, GitBook, Docusaurus, o un generador de sitios estáticos que usa Markdown
- Archivar una base de conocimiento --- preservar la documentación del equipo antes de que expire una licencia de Atlassian
- Construir una base de conocimiento para IA --- alimentar a Claude, ChatGPT o un LLM interno con documentación limpia
- Hacer copia de seguridad de documentos críticos --- tener una copia portable que no dependa de los servidores de Atlassian
- Escapar del bloqueo del proveedor --- poseer el contenido en un formato universal
Método 1: Save (el más rápido para páginas individuales)
Save es una extensión de Chrome que convierte cualquier página de Confluence en Markdown limpio con un solo clic.
Cómo funciona:
- Abre cualquier página de Confluence en Chrome
- Haz clic en el icono de la extensión Save
- Un archivo
.mdse descarga instantáneamente
Lo que obtienes:
- Texto completo de la página con jerarquía de encabezados
- Tablas formateadas como tablas Markdown
- Bloques de código con etiquetas de lenguaje
- Paneles de información convertidos en citas en bloque
- Secciones expandir/contraer (completamente expandidas)
- Metadatos limpios: título de la página, nombre del espacio, fecha de última actualización
- Enlaces internos y externos conservados
Lo que se elimina:
- Macros de Atlassian y formato propietario
- Navegación, barras laterales y menús
- Artefactos del editor WYSIWYG
- Estilos en línea y CSS
Ideal para: Guardar páginas individuales o pequeños lotes. Para 5 a 50 páginas, este es el método más rápido.
Ejemplo de salida
De un runbook típico de Confluence:
# Deployment Runbook --- Production API
**Space:** Engineering
**Last updated:** March 12, 2026
---
## Pre-Deployment Checklist
- [ ] All CI checks passing on `main`
- [ ] Database migrations reviewed and approved
- [ ] Feature flags configured for gradual rollout
- [ ] Rollback plan documented
## Deployment Steps
### 1. Create Release Branch
\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`
### 2. Run Database Migrations
\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`
Método 2: Exportación integrada de Confluence (HTML y luego convertir)
Confluence puede exportar páginas como HTML. Luego puedes convertir el HTML a Markdown usando una herramienta como Pandoc.
Pasos:
- Ir a la página → menú … → Exportar a PDF/Word/HTML
- Elegir exportación HTML
- Convertir con Pandoc:
pandoc input.html -o output.md
Problemas con este enfoque:
- La exportación HTML incluye el CSS de Atlassian, macros y estilos en línea
- Las tablas frecuentemente se rompen durante la conversión
- Los bloques de código pierden las etiquetas de lenguaje
- Las imágenes hacen referencia a URLs de Confluence que pueden romperse más adelante
- Las páginas anidadas requieren exportar todo el espacio
Este método funciona pero produce una salida desordenada que necesita limpieza manual.
Método 3: Exportación de espacio + conversión masiva
Para exportar un espacio de Confluence completo:
- Ir a Configuración del espacio → Herramientas de contenido → Exportar
- Elegir el formato HTML
- Descargar el archivo ZIP
- Usar un script para convertir en lote los archivos HTML a Markdown
El problema: Las exportaciones de espacios de Confluence producen HTML profundamente anidado con enlaces relativos rotos, elementos de navegación duplicados y marcado específico de Atlassian. Limpiar esto de forma programática es un proyecto de fin de semana.
Método 4: API REST de Confluence
Para acceso programático:
curl -u [email protected]:API_TOKEN \
"https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
| jq -r '.body.storage.value' > page.html
Esto te da el formato de almacenamiento bruto (similar a XHTML). Necesitarás:
- Analizar el formato de almacenamiento de Atlassian
- Manejar macros, incrustaciones y elementos especiales
- Convertir a Markdown
- Repetir para cada página
Ideal para: Equipos de ingeniería que construyen un pipeline de migración. Excesivo para la mayoría de los casos de uso.
¿Qué método deberías usar?
| Escenario | Mejor método |
|---|---|
| Guardar 1-50 páginas rápidamente | Extensión Save --- un clic por página |
| Archivar un espacio completo | Exportación de espacio + Pandoc --- masivo pero desordenado |
| Construir un pipeline de migración | API REST --- programático pero complejo |
| Copia de seguridad rápida de docs clave | Extensión Save --- salida más limpia |
| Alimentar docs a un LLM | Extensión Save --- Markdown es nativo para LLM |
Para la mayoría de las personas, Save es la respuesta. Produce el Markdown más limpio sin ninguna configuración y maneja automáticamente el formato propietario de Confluence.
Hacer útil tu contenido de Confluence
Una vez que hayas exportado tus páginas a Markdown, puedes:
- Buscar en todo con grep, VS Code u Obsidian
- Dárselo a Claude o ChatGPT para obtener respuestas instantáneas sobre tu documentación
- Versionarlo en Git --- rastrear cambios en tus docs como código
- Importarlo en cualquier herramienta --- Notion, Obsidian, GitBook, Docusaurus o un generador de sitios estáticos
- Conservarlo para siempre --- los archivos Markdown son texto plano. Serán legibles en 50 años
Empezar
Instala Save y pruébalo en una página de Confluence ahora mismo. Es gratis para empezar y verás Markdown limpio en segundos.
Escapar de Confluence no tiene que ser doloroso. Save convierte cualquier página a Markdown limpio con un clic.