Como Exportar Páginas do Confluence para Markdown (Guia 2026)
O Confluence não quer que você vá embora. A Atlassian armazena seu conteúdo em um formato XML proprietário, não oferece exportação para Markdown e torna a extração em massa dolorosa. Se você já tentou obter texto limpo do Confluence, conhece a frustração.
Este guia cobre todos os métodos para exportar páginas do Confluence para Markdown --- de páginas individuais a espaços inteiros.
Por Que Exportar do Confluence para Markdown?
Equipes se afastam do Confluence por muitos motivos:
- Migrando para uma nova ferramenta --- mudando para Notion, GitBook, Docusaurus ou um gerador de sites estáticos que espera Markdown
- Arquivando uma base de conhecimento --- preservando a documentação da equipe antes de uma licença Atlassian expirar
- Construindo uma base de conhecimento AI --- alimentando documentação limpa para Claude, ChatGPT ou um LLM interno
- Fazendo backup de documentos críticos --- tendo uma cópia portátil que não depende dos servidores da Atlassian
- Escapando do vendor lock-in --- sendo dono do seu conteúdo em um formato universal
Método 1: Save (Mais Rápido para Páginas Individuais)
Save é uma extensão Chrome que converte qualquer página do Confluence para Markdown limpo com um clique.
Como funciona:
- Abra qualquer página do Confluence no Chrome
- Clique no ícone da extensão Save
- Um arquivo
.mdé baixado instantaneamente
O que você recebe:
- Texto completo da página com hierarquia de títulos
- Tabelas formatadas como tabelas Markdown
- Blocos de código com tags de linguagem
- Painéis de informação convertidos em citações em bloco
- Seções expandir/recolher (totalmente expandidas)
- Metadados limpos: título da página, nome do espaço, data de última atualização
- Links internos e externos preservados
O que é removido:
- Macros Atlassian e formatação proprietária
- Chrome de navegação, barras laterais e menus
- Artefatos do editor WYSIWYG
- Estilos inline e CSS
Melhor para: Salvar páginas individuais ou pequenos lotes. Se você precisa de 5-50 páginas, este é o método mais rápido.
Exemplo de Output
De um runbook típico do Confluence:
# Deployment Runbook --- Production API
**Space:** Engineering
**Last updated:** March 12, 2026
---
## Pre-Deployment Checklist
- [ ] All CI checks passing on `main`
- [ ] Database migrations reviewed and approved
- [ ] Feature flags configured for gradual rollout
- [ ] Rollback plan documented
## Deployment Steps
### 1. Create Release Branch
\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`
### 2. Run Database Migrations
\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`
Método 2: Exportação Integrada do Confluence (HTML, Depois Converta)
O Confluence pode exportar páginas como HTML. Você pode então converter o HTML para Markdown usando uma ferramenta como Pandoc.
Passos:
- Vá para a página → menu … → Exportar para PDF/Word/HTML
- Escolha exportação HTML
- Converta com Pandoc:
pandoc input.html -o output.md
Problemas com esta abordagem:
- A exportação HTML inclui CSS da Atlassian, macros e estilos inline
- Tabelas frequentemente quebram durante a conversão
- Blocos de código perdem tags de linguagem
- Imagens referenciam URLs do Confluence que podem quebrar mais tarde
- Páginas aninhadas requerem exportar o espaço inteiro
Este método funciona mas produz output bagunçado que precisa de limpeza manual.
Método 3: Exportação de Espaço + Conversão em Massa
Para exportar um espaço inteiro do Confluence:
- Vá para Configurações do Espaço → Ferramentas de Conteúdo → Exportar
- Escolha o formato HTML
- Baixe o arquivo ZIP
- Use um script para converter em lote os arquivos HTML para Markdown
O problema: As exportações de espaço do Confluence produzem HTML profundamente aninhado com links relativos quebrados, elementos de navegação duplicados e marcação específica da Atlassian. Limpar isso programaticamente é um projeto de fim de semana.
Método 4: REST API do Confluence
Para acesso programático:
curl -u [email protected]:API_TOKEN \
"https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
| jq -r '.body.storage.value' > page.html
Isso fornece o formato de armazenamento bruto (semelhante a XHTML). Você precisará:
- Fazer parse do formato de armazenamento Atlassian
- Lidar com macros, embeds e elementos especiais
- Converter para Markdown
- Repetir para cada página
Melhor para: Equipes de engenharia construindo uma pipeline de migração. Excessivo para a maioria dos casos de uso.
Qual Método Usar?
| Cenário | Melhor Método |
|---|---|
| Salvar 1-50 páginas rapidamente | Extensão Save --- um clique por página |
| Arquivar um espaço inteiro | Exportação de espaço + Pandoc --- em massa mas bagunçado |
| Construir uma pipeline de migração | REST API --- programático mas complexo |
| Backup rápido de documentos chave | Extensão Save --- output mais limpo |
| Alimentar documentos a um LLM | Extensão Save --- Markdown é nativo para LLM |
Para a maioria das pessoas, o Save é a resposta. Ele produz o Markdown mais limpo sem nenhuma configuração e lida automaticamente com a formatação proprietária do Confluence.
Tornando Seu Conteúdo Confluence Útil
Depois de exportar suas páginas para Markdown, você pode:
- Pesquisar em tudo com grep, VS Code ou Obsidian
- Alimentar para Claude ou ChatGPT para respostas imediatas sobre sua documentação
- Controlar versão em Git --- rastrear mudanças nos seus docs como código
- Importar para qualquer ferramenta --- Notion, Obsidian, GitBook, Docusaurus ou um gerador de sites estáticos
- Guardar para sempre --- arquivos Markdown são texto simples. Serão legíveis em 50 anos
Comece
Instale o Save e experimente em uma página do Confluence agora mesmo. É grátis para começar, e você verá Markdown limpo em segundos.
Escapar do Confluence não precisa ser doloroso. Save converte qualquer página para Markdown limpo com um clique.