如何將 Confluence 頁面匯出為 Markdown(2026 指南)
Confluence 不想讓你離開。Atlassian 以專有 XML 格式儲存你的內容,不提供 Markdown 匯出,並使批量擷取變得痛苦。如果你曾經嘗試過從 Confluence 擷取乾淨的文字,你就知道那種挫敗感。
本指南涵蓋將 Confluence 頁面匯出為 Markdown 的每種方法——從單個頁面到整個空間。
為什麼要將 Confluence 匯出為 Markdown?
團隊離開 Confluence 有很多原因:
- 遷移到新工具 — 轉移到期望 Markdown 的 Notion、GitBook、Docusaurus 或靜態網站生成器
- 封存知識庫 — 在 Atlassian 授權到期前儲存團隊文件
- 建構 AI 知識庫 — 將乾淨的文件提供給 Claude、ChatGPT 或內部 LLM
- 備份關鍵文件 — 擁有不依賴 Atlassian 伺服器的可攜帶副本
- 擺脫供應商鎖定 — 以通用格式擁有自己的內容
方法一:Save(單個頁面最快)
Save 是一個 Chrome 擴充功能,只需一鍵即可將任何 Confluence 頁面轉換為乾淨的 Markdown。
運作方式:
- 在 Chrome 中開啟任意 Confluence 頁面
- 點擊 Save 擴充功能圖示
- 立即下載一個
.md檔案
你得到什麼:
- 具有標題層次結構的完整頁面文字
- 格式化為 Markdown 表格的表格
- 帶有語言標籤的程式碼區塊
- 轉換為區塊引用的資訊面板
- 展開/折疊部分(完全展開)
- 乾淨的元資料:頁面標題、空間名稱、最後更新日期
- 保留內部和外部連結
什麼被移除:
- Atlassian 巨集和專有格式
- 導覽框架、側邊欄和選單
- 所見即所得編輯器產物
- 內聯樣式和 CSS
最適合: 儲存單個頁面或小批量。如果你需要 5-50 個頁面,這是最快的方法。
範例輸出
來自典型 Confluence 運行手冊:
# 部署運行手冊 --- 生產 API
**空間:** Engineering
**最後更新:** 2026 年 3 月 12 日
---
## 部署前檢查清單
- [ ] `main` 上的所有 CI 檢查通過
- [ ] 資料庫遷移已審查和批准
- [ ] 為漸進式推出設定了功能旗標
- [ ] 已記錄回滾計畫
## 部署步驟
### 1. 建立發布分支
\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`
### 2. 執行資料庫遷移
\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`
方法二:Confluence 內建匯出(HTML,然後轉換)
Confluence 可以將頁面匯出為 HTML。然後你可以使用 Pandoc 等工具將 HTML 轉換為 Markdown。
步驟:
- 進入頁面 → … 選單 → 匯出為 PDF/Word/HTML
- 選擇 HTML 匯出
- 用 Pandoc 轉換:
pandoc input.html -o output.md
這種方法的問題:
- HTML 匯出包含 Atlassian 的 CSS、巨集和內聯樣式
- 轉換過程中表格經常損壞
- 程式碼區塊丟失語言標籤
- 圖片引用的是可能以後失效的 Confluence URL
- 巢狀頁面需要匯出整個空間
這種方法可行,但產生的輸出品質較差,需要手動清理。
方法三:空間匯出 + 批量轉換
匯出整個 Confluence 空間:
- 進入空間設定 → 內容工具 → 匯出
- 選擇 HTML 格式
- 下載 ZIP 壓縮檔
- 使用腳本批量將 HTML 檔案轉換為 Markdown
問題: Confluence 空間匯出產生深度巢狀的 HTML,帶有損壞的相對連結、重複的導覽元素和 Atlassian 特定的標記。以程式化方式清理這些是一個週末專案。
方法四:Confluence REST API
用於程式化存取:
curl -u [email protected]:API_TOKEN \
"https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
| jq -r '.body.storage.value' > page.html
這給你原始儲存格式(類似 XHTML)。你需要:
- 解析 Atlassian 儲存格式
- 處理巨集、嵌入和特殊元素
- 轉換為 Markdown
- 對每個頁面重複此過程
最適合: 建構遷移管道的工程團隊。對大多數使用案例來說過於複雜。
應該使用哪種方法?
| 情境 | 最佳方法 |
|---|---|
| 快速儲存 1-50 個頁面 | Save 擴充功能 — 每頁一鍵 |
| 封存整個空間 | 空間匯出 + Pandoc — 批量但品質較差 |
| 建構遷移管道 | REST API — 程式化但複雜 |
| 關鍵文件的快速備份 | Save 擴充功能 — 最乾淨的輸出 |
| 將文件提供給 LLM | Save 擴充功能 — Markdown 是 LLM 原生的 |
對大多數人來說,Save 是答案。它無需設定即可產生最乾淨的 Markdown,並自動處理 Confluence 的專有格式。
讓 Confluence 內容變得有用
將頁面匯出為 Markdown 後,你可以:
- 用 grep、VS Code 或 Obsidian 搜尋所有內容
- 將其提供給 Claude 或 ChatGPT 獲取關於文件的即時答案
- 在 Git 中進行版本控制 — 像程式碼一樣追蹤文件變更
- 匯入到任何工具 — Notion、Obsidian、GitBook、Docusaurus 或靜態網站生成器
- 永久儲存 — Markdown 檔案是純文字。50 年後仍可讀
開始
安裝 Save 並立即在 Confluence 頁面上試用。免費開始,幾秒鐘內就能看到乾淨的 Markdown。
擺脫 Confluence 不必痛苦。Save 只需一鍵即可將任何頁面轉換為乾淨的 Markdown。