Volver al blog

Cómo exportar páginas de Confluence a Markdown (guía 2026)

·
#confluence#markdown#documentation#enterprise#migration

Confluence no quiere que te vayas. Atlassian almacena tu contenido en un formato XML propietario, no ofrece exportación a Markdown y hace que la extracción masiva sea dolorosa. Si alguna vez has intentado obtener texto limpio de Confluence, conoces la frustración.

Esta guía cubre todos los métodos para exportar páginas de Confluence a Markdown --- desde páginas individuales hasta espacios completos.

¿Por qué exportar Confluence a Markdown?

Los equipos se alejan de Confluence por muchas razones:

  • Migrar a una nueva herramienta --- moverse a Notion, GitBook, Docusaurus, o un generador de sitios estáticos que usa Markdown
  • Archivar una base de conocimiento --- preservar la documentación del equipo antes de que expire una licencia de Atlassian
  • Construir una base de conocimiento para IA --- alimentar a Claude, ChatGPT o un LLM interno con documentación limpia
  • Hacer copia de seguridad de documentos críticos --- tener una copia portable que no dependa de los servidores de Atlassian
  • Escapar del bloqueo del proveedor --- poseer el contenido en un formato universal

Método 1: Save (el más rápido para páginas individuales)

Save es una extensión de Chrome que convierte cualquier página de Confluence en Markdown limpio con un solo clic.

Cómo funciona:

  1. Abre cualquier página de Confluence en Chrome
  2. Haz clic en el icono de la extensión Save
  3. Un archivo .md se descarga instantáneamente

Lo que obtienes:

  • Texto completo de la página con jerarquía de encabezados
  • Tablas formateadas como tablas Markdown
  • Bloques de código con etiquetas de lenguaje
  • Paneles de información convertidos en citas en bloque
  • Secciones expandir/contraer (completamente expandidas)
  • Metadatos limpios: título de la página, nombre del espacio, fecha de última actualización
  • Enlaces internos y externos conservados

Lo que se elimina:

  • Macros de Atlassian y formato propietario
  • Navegación, barras laterales y menús
  • Artefactos del editor WYSIWYG
  • Estilos en línea y CSS

Ideal para: Guardar páginas individuales o pequeños lotes. Para 5 a 50 páginas, este es el método más rápido.

Ejemplo de salida

De un runbook típico de Confluence:

# Deployment Runbook --- Production API

**Space:** Engineering
**Last updated:** March 12, 2026

---

## Pre-Deployment Checklist

- [ ] All CI checks passing on `main`
- [ ] Database migrations reviewed and approved
- [ ] Feature flags configured for gradual rollout
- [ ] Rollback plan documented

## Deployment Steps

### 1. Create Release Branch

\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`

### 2. Run Database Migrations

\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`

Método 2: Exportación integrada de Confluence (HTML y luego convertir)

Confluence puede exportar páginas como HTML. Luego puedes convertir el HTML a Markdown usando una herramienta como Pandoc.

Pasos:

  1. Ir a la página → menú Exportar a PDF/Word/HTML
  2. Elegir exportación HTML
  3. Convertir con Pandoc: pandoc input.html -o output.md

Problemas con este enfoque:

  • La exportación HTML incluye el CSS de Atlassian, macros y estilos en línea
  • Las tablas frecuentemente se rompen durante la conversión
  • Los bloques de código pierden las etiquetas de lenguaje
  • Las imágenes hacen referencia a URLs de Confluence que pueden romperse más adelante
  • Las páginas anidadas requieren exportar todo el espacio

Este método funciona pero produce una salida desordenada que necesita limpieza manual.

Método 3: Exportación de espacio + conversión masiva

Para exportar un espacio de Confluence completo:

  1. Ir a Configuración del espacioHerramientas de contenidoExportar
  2. Elegir el formato HTML
  3. Descargar el archivo ZIP
  4. Usar un script para convertir en lote los archivos HTML a Markdown

El problema: Las exportaciones de espacios de Confluence producen HTML profundamente anidado con enlaces relativos rotos, elementos de navegación duplicados y marcado específico de Atlassian. Limpiar esto de forma programática es un proyecto de fin de semana.

Método 4: API REST de Confluence

Para acceso programático:

curl -u [email protected]:API_TOKEN \
  "https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
  | jq -r '.body.storage.value' > page.html

Esto te da el formato de almacenamiento bruto (similar a XHTML). Necesitarás:

  1. Analizar el formato de almacenamiento de Atlassian
  2. Manejar macros, incrustaciones y elementos especiales
  3. Convertir a Markdown
  4. Repetir para cada página

Ideal para: Equipos de ingeniería que construyen un pipeline de migración. Excesivo para la mayoría de los casos de uso.

¿Qué método deberías usar?

EscenarioMejor método
Guardar 1-50 páginas rápidamenteExtensión Save --- un clic por página
Archivar un espacio completoExportación de espacio + Pandoc --- masivo pero desordenado
Construir un pipeline de migraciónAPI REST --- programático pero complejo
Copia de seguridad rápida de docs claveExtensión Save --- salida más limpia
Alimentar docs a un LLMExtensión Save --- Markdown es nativo para LLM

Para la mayoría de las personas, Save es la respuesta. Produce el Markdown más limpio sin ninguna configuración y maneja automáticamente el formato propietario de Confluence.

Hacer útil tu contenido de Confluence

Una vez que hayas exportado tus páginas a Markdown, puedes:

  • Buscar en todo con grep, VS Code u Obsidian
  • Dárselo a Claude o ChatGPT para obtener respuestas instantáneas sobre tu documentación
  • Versionarlo en Git --- rastrear cambios en tus docs como código
  • Importarlo en cualquier herramienta --- Notion, Obsidian, GitBook, Docusaurus o un generador de sitios estáticos
  • Conservarlo para siempre --- los archivos Markdown son texto plano. Serán legibles en 50 años

Empezar

Instala Save y pruébalo en una página de Confluence ahora mismo. Es gratis para empezar y verás Markdown limpio en segundos.


Escapar de Confluence no tiene que ser doloroso. Save convierte cualquier página a Markdown limpio con un clic.