Как экспортировать страницы Confluence в Markdown (Руководство 2026)
Confluence не хочет, чтобы вы уходили. Atlassian хранит ваш контент в проприетарном XML-формате, не предлагает экспорт в Markdown и делает массовое извлечение болезненным. Если вы когда-либо пытались получить чистый текст из Confluence, вы знаете это разочарование.
В этом руководстве рассматриваются все методы экспорта страниц Confluence в Markdown — от отдельных страниц до целых пространств.
Зачем экспортировать Confluence в Markdown?
Команды покидают Confluence по многим причинам:
- Переход на новый инструмент — переезд в Notion, GitBook, Docusaurus или генератор статических сайтов, ожидающий Markdown
- Архивация базы знаний — сохранение командной документации до истечения лицензии Atlassian
- Создание AI-базы знаний — подача чистой документации Claude, ChatGPT или внутреннему LLM
- Резервное копирование критичных документов — наличие переносимой копии, не зависящей от серверов Atlassian
- Выход из вендор-локина — владение своим контентом в универсальном формате
Метод 1: Save (Быстрее всего для отдельных страниц)
Save — расширение Chrome, конвертирующее любую страницу Confluence в чистый Markdown одним кликом.
Как работает:
- Откройте любую страницу Confluence в Chrome
- Нажмите иконку расширения Save
- Файл
.mdскачивается мгновенно
Что вы получаете:
- Полный текст страницы с иерархией заголовков
- Таблицы, отформатированные как Markdown-таблицы
- Блоки кода с языковыми тегами
- Информационные панели, конвертированные в блочные цитаты
- Разворачиваемые разделы (полностью развёрнуты)
- Чистые метаданные: заголовок страницы, название пространства, дата последнего обновления
- Сохранённые внутренние и внешние ссылки
Что удаляется:
- Макросы Atlassian и проприетарное форматирование
- Навигационные элементы, боковые панели и меню
- Артефакты WYSIWYG-редактора
- Инлайн-стили и CSS
Лучше всего для: Сохранения отдельных страниц или небольших партий. Если вам нужно 5-50 страниц, это самый быстрый метод.
Пример вывода
Из типичного runbook’а Confluence:
# Runbook по развёртыванию — Production API
**Пространство:** Engineering
**Последнее обновление:** 12 марта 2026
---
## Чеклист перед развёртыванием
- [ ] Все CI-проверки на `main` пройдены
- [ ] Миграции базы данных проверены и одобрены
- [ ] Флаги функций настроены для постепенного развёртывания
- [ ] Задокументирован план отката
## Шаги развёртывания
### 1. Создать ветку релиза
\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`
### 2. Запустить миграции базы данных
\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`
Метод 2: Встроенный экспорт Confluence (HTML, затем конвертация)
Confluence может экспортировать страницы в HTML. Затем можно конвертировать HTML в Markdown с помощью инструмента вроде Pandoc.
Шаги:
- Перейдите на страницу → меню … → Экспорт в PDF/Word/HTML
- Выберите HTML-экспорт
- Конвертируйте с Pandoc:
pandoc input.html -o output.md
Проблемы этого подхода:
- HTML-экспорт включает CSS Atlassian, макросы и инлайн-стили
- Таблицы часто ломаются при конвертации
- Блоки кода теряют языковые теги
- Изображения ссылаются на URL Confluence, которые могут позже сломаться
- Вложенные страницы требуют экспорта всего пространства
Метод работает, но производит неаккуратный вывод, требующий ручной очистки.
Метод 3: Экспорт пространства + Массовая конвертация
Для экспорта всего пространства Confluence:
- Перейдите в Настройки пространства → Инструменты контента → Экспорт
- Выберите формат HTML
- Скачайте ZIP-архив
- Используйте скрипт для массовой конвертации HTML-файлов в Markdown
Проблема: Экспорты пространства Confluence производят глубоко вложенный HTML с неработающими относительными ссылками, дублирующимися навигационными элементами и разметкой Atlassian. Программная очистка этого — weekend-проект.
Метод 4: REST API Confluence
Для программного доступа:
curl -u [email protected]:API_TOKEN \
"https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
| jq -r '.body.storage.value' > page.html
Это даёт вам формат хранения (XHTML-подобный). Вам потребуется:
- Разобрать формат хранения Atlassian
- Обработать макросы, вставки и специальные элементы
- Конвертировать в Markdown
- Повторить для каждой страницы
Лучше всего для: Инженерных команд, строящих пайплайн миграции. Излишне для большинства случаев использования.
Какой метод выбрать?
| Сценарий | Лучший метод |
|---|---|
| Быстро сохранить 1-50 страниц | Расширение Save — один клик на страницу |
| Архивировать целое пространство | Экспорт + Pandoc — массово, но грязно |
| Создать пайплайн миграции | REST API — программно, но сложно |
| Быстрое резервное копирование ключевых документов | Расширение Save — чистейший вывод |
| Передать документы LLM | Расширение Save — Markdown нативен для LLM |
Для большинства людей ответ — Save. Он производит чистейший Markdown без настройки и автоматически обрабатывает проприетарное форматирование Confluence.
Сделайте контент Confluence полезным
После экспорта страниц в Markdown вы можете:
- Искать по всему с grep, VS Code или Obsidian
- Передать в Claude или ChatGPT для мгновенных ответов о документации
- Вести версионный контроль в Git — отслеживать изменения в документах как код
- Импортировать в любой инструмент — Notion, Obsidian, GitBook, Docusaurus или генератор статических сайтов
- Хранить вечно — файлы Markdown — это обычный текст. Они будут читаемы через 50 лет
Начало работы
Установите Save и попробуйте прямо сейчас на странице Confluence. Бесплатно с первого дня, и вы увидите чистый Markdown за несколько секунд.
Уйти из Confluence не обязательно болезненно. Save конвертирует любую страницу в чистый Markdown одним кликом.