如何将 Confluence 页面导出为 Markdown(2026 指南)
Confluence 不想让你离开。Atlassian 以专有 XML 格式存储你的内容,不提供 Markdown 导出,并使批量提取变得痛苦。如果你曾经尝试过从 Confluence 提取干净的文本,你就知道那种挫败感。
本指南涵盖将 Confluence 页面导出为 Markdown 的每种方法——从单个页面到整个空间。
为什么要将 Confluence 导出为 Markdown?
团队离开 Confluence 有很多原因:
- 迁移到新工具 — 转移到期望 Markdown 的 Notion、GitBook、Docusaurus 或静态网站生成器
- 归档知识库 — 在 Atlassian 许可证到期前保存团队文档
- 构建 AI 知识库 — 将干净的文档提供给 Claude、ChatGPT 或内部 LLM
- 备份关键文档 — 拥有不依赖 Atlassian 服务器的便携副本
- 摆脱供应商锁定 — 以通用格式拥有自己的内容
方法 1:Save(单个页面最快)
Save 是一个 Chrome 扩展,只需一键即可将任何 Confluence 页面转换为干净的 Markdown。
工作原理:
- 在 Chrome 中打开任意 Confluence 页面
- 点击 Save 扩展图标
- 立即下载一个
.md文件
你得到什么:
- 具有标题层次结构的完整页面文本
- 格式化为 Markdown 表格的表格
- 带有语言标签的代码块
- 转换为块引用的信息面板
- 展开/折叠部分(完全展开)
- 干净的元数据:页面标题、空间名称、最后更新日期
- 保留内部和外部链接
什么被移除:
- Atlassian 宏和专有格式
- 导航框架、侧边栏和菜单
- 所见即所得编辑器产物
- 内联样式和 CSS
最适合: 保存单个页面或小批量。如果你需要 5-50 个页面,这是最快的方法。
示例输出
来自典型 Confluence 运行手册:
# 部署运行手册 --- 生产 API
**空间:** Engineering
**最后更新:** 2026 年 3 月 12 日
---
## 部署前检查清单
- [ ] `main` 上的所有 CI 检查通过
- [ ] 数据库迁移已审查和批准
- [ ] 为渐进式推出配置了功能标志
- [ ] 已记录回滚计划
## 部署步骤
### 1. 创建发布分支
\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`
### 2. 运行数据库迁移
\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`
方法 2:Confluence 内置导出(HTML,然后转换)
Confluence 可以将页面导出为 HTML。然后你可以使用 Pandoc 等工具将 HTML 转换为 Markdown。
步骤:
- 进入页面 → … 菜单 → 导出为 PDF/Word/HTML
- 选择 HTML 导出
- 用 Pandoc 转换:
pandoc input.html -o output.md
这种方法的问题:
- HTML 导出包含 Atlassian 的 CSS、宏和内联样式
- 转换过程中表格经常损坏
- 代码块丢失语言标签
- 图片引用的是可能以后失效的 Confluence URL
- 嵌套页面需要导出整个空间
这种方法可行,但产生的输出质量较差,需要手动清理。
方法 3:空间导出 + 批量转换
导出整个 Confluence 空间:
- 进入空间设置 → 内容工具 → 导出
- 选择 HTML 格式
- 下载 ZIP 存档
- 使用脚本批量将 HTML 文件转换为 Markdown
问题: Confluence 空间导出产生深度嵌套的 HTML,带有损坏的相对链接、重复的导航元素和 Atlassian 特定的标记。以编程方式清理这些是一个周末项目。
方法 4:Confluence REST API
用于程序化访问:
curl -u [email protected]:API_TOKEN \
"https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
| jq -r '.body.storage.value' > page.html
这给你原始存储格式(类似 XHTML)。你需要:
- 解析 Atlassian 存储格式
- 处理宏、嵌入和特殊元素
- 转换为 Markdown
- 对每个页面重复此过程
最适合: 构建迁移管道的工程团队。对大多数用例来说过于复杂。
应该使用哪种方法?
| 场景 | 最佳方法 |
|---|---|
| 快速保存 1-50 个页面 | Save 扩展 — 每页一键 |
| 归档整个空间 | 空间导出 + Pandoc — 批量但质量较差 |
| 构建迁移管道 | REST API — 程序化但复杂 |
| 关键文档的快速备份 | Save 扩展 — 最干净的输出 |
| 将文档提供给 LLM | Save 扩展 — Markdown 是 LLM 原生的 |
对大多数人来说,Save 是答案。它无需设置即可产生最干净的 Markdown,并自动处理 Confluence 的专有格式。
让 Confluence 内容变得有用
将页面导出为 Markdown 后,你可以:
- 用 grep、VS Code 或 Obsidian 搜索所有内容
- 将其提供给 Claude 或 ChatGPT 获取关于文档的即时答案
- 在 Git 中进行版本控制 — 像代码一样跟踪文档变更
- 导入到任何工具 — Notion、Obsidian、GitBook、Docusaurus 或静态网站生成器
- 永久保存 — Markdown 文件是纯文本。50 年后仍可读
开始
安装 Save 并立即在 Confluence 页面上试用。免费开始,几秒钟内就能看到干净的 Markdown。
摆脱 Confluence 不必痛苦。Save 只需一键即可将任何页面转换为干净的 Markdown。