返回部落格

如何將 Confluence 頁面匯出為 Markdown(2026 指南)

·
#confluence#markdown#documentation#enterprise#migration

Confluence 不想讓你離開。Atlassian 以專有 XML 格式儲存你的內容,不提供 Markdown 匯出,並使批量擷取變得痛苦。如果你曾經嘗試過從 Confluence 擷取乾淨的文字,你就知道那種挫敗感。

本指南涵蓋將 Confluence 頁面匯出為 Markdown 的每種方法——從單個頁面到整個空間。

為什麼要將 Confluence 匯出為 Markdown?

團隊離開 Confluence 有很多原因:

  • 遷移到新工具 — 轉移到期望 Markdown 的 Notion、GitBook、Docusaurus 或靜態網站生成器
  • 封存知識庫 — 在 Atlassian 授權到期前儲存團隊文件
  • 建構 AI 知識庫 — 將乾淨的文件提供給 Claude、ChatGPT 或內部 LLM
  • 備份關鍵文件 — 擁有不依賴 Atlassian 伺服器的可攜帶副本
  • 擺脫供應商鎖定 — 以通用格式擁有自己的內容

方法一:Save(單個頁面最快)

Save 是一個 Chrome 擴充功能,只需一鍵即可將任何 Confluence 頁面轉換為乾淨的 Markdown。

運作方式:

  1. 在 Chrome 中開啟任意 Confluence 頁面
  2. 點擊 Save 擴充功能圖示
  3. 立即下載一個 .md 檔案

你得到什麼:

  • 具有標題層次結構的完整頁面文字
  • 格式化為 Markdown 表格的表格
  • 帶有語言標籤的程式碼區塊
  • 轉換為區塊引用的資訊面板
  • 展開/折疊部分(完全展開)
  • 乾淨的元資料:頁面標題、空間名稱、最後更新日期
  • 保留內部和外部連結

什麼被移除:

  • Atlassian 巨集和專有格式
  • 導覽框架、側邊欄和選單
  • 所見即所得編輯器產物
  • 內聯樣式和 CSS

最適合: 儲存單個頁面或小批量。如果你需要 5-50 個頁面,這是最快的方法。

範例輸出

來自典型 Confluence 運行手冊:

# 部署運行手冊 --- 生產 API

**空間:** Engineering
**最後更新:** 2026 年 3 月 12 日

---

## 部署前檢查清單

- [ ] `main` 上的所有 CI 檢查通過
- [ ] 資料庫遷移已審查和批准
- [ ] 為漸進式推出設定了功能旗標
- [ ] 已記錄回滾計畫

## 部署步驟

### 1. 建立發布分支

\`\`\`bash
git checkout -b release/v2.4.0 main
git push origin release/v2.4.0
\`\`\`

### 2. 執行資料庫遷移

\`\`\`sql
ALTER TABLE users ADD COLUMN preferences JSONB DEFAULT '{}';
CREATE INDEX idx_users_preferences ON users USING GIN (preferences);
\`\`\`

方法二:Confluence 內建匯出(HTML,然後轉換)

Confluence 可以將頁面匯出為 HTML。然後你可以使用 Pandoc 等工具將 HTML 轉換為 Markdown。

步驟:

  1. 進入頁面 → 選單 → 匯出為 PDF/Word/HTML
  2. 選擇 HTML 匯出
  3. 用 Pandoc 轉換:pandoc input.html -o output.md

這種方法的問題:

  • HTML 匯出包含 Atlassian 的 CSS、巨集和內聯樣式
  • 轉換過程中表格經常損壞
  • 程式碼區塊丟失語言標籤
  • 圖片引用的是可能以後失效的 Confluence URL
  • 巢狀頁面需要匯出整個空間

這種方法可行,但產生的輸出品質較差,需要手動清理。

方法三:空間匯出 + 批量轉換

匯出整個 Confluence 空間:

  1. 進入空間設定內容工具匯出
  2. 選擇 HTML 格式
  3. 下載 ZIP 壓縮檔
  4. 使用腳本批量將 HTML 檔案轉換為 Markdown

問題: Confluence 空間匯出產生深度巢狀的 HTML,帶有損壞的相對連結、重複的導覽元素和 Atlassian 特定的標記。以程式化方式清理這些是一個週末專案。

方法四:Confluence REST API

用於程式化存取:

curl -u [email protected]:API_TOKEN \
  "https://your-domain.atlassian.net/wiki/rest/api/content/PAGE_ID?expand=body.storage" \
  | jq -r '.body.storage.value' > page.html

這給你原始儲存格式(類似 XHTML)。你需要:

  1. 解析 Atlassian 儲存格式
  2. 處理巨集、嵌入和特殊元素
  3. 轉換為 Markdown
  4. 對每個頁面重複此過程

最適合: 建構遷移管道的工程團隊。對大多數使用案例來說過於複雜。

應該使用哪種方法?

情境最佳方法
快速儲存 1-50 個頁面Save 擴充功能 — 每頁一鍵
封存整個空間空間匯出 + Pandoc — 批量但品質較差
建構遷移管道REST API — 程式化但複雜
關鍵文件的快速備份Save 擴充功能 — 最乾淨的輸出
將文件提供給 LLMSave 擴充功能 — Markdown 是 LLM 原生的

對大多數人來說,Save 是答案。它無需設定即可產生最乾淨的 Markdown,並自動處理 Confluence 的專有格式。

讓 Confluence 內容變得有用

將頁面匯出為 Markdown 後,你可以:

  • 用 grep、VS Code 或 Obsidian 搜尋所有內容
  • 將其提供給 Claude 或 ChatGPT 獲取關於文件的即時答案
  • 在 Git 中進行版本控制 — 像程式碼一樣追蹤文件變更
  • 匯入到任何工具 — Notion、Obsidian、GitBook、Docusaurus 或靜態網站生成器
  • 永久儲存 — Markdown 檔案是純文字。50 年後仍可讀

開始

安裝 Save 並立即在 Confluence 頁面上試用。免費開始,幾秒鐘內就能看到乾淨的 Markdown。


擺脫 Confluence 不必痛苦。Save 只需一鍵即可將任何頁面轉換為乾淨的 Markdown。