如何將 Substack 貼文儲存為 Markdown(支援付費牆,無交叉推廣)

·

Substack 不希望你帶著內容離開。沒有原生匯出、沒有「下載此貼文」按鈕、沒有公共 API 讓付費訂閱者備份他們已付費的文章。你打開的每一篇貼文都被訂閱模態覆蓋層、網路中其他電子報的交叉推廣區塊,以及哀求郵件地址的頁尾所包圍。如果你曾試圖將 Substack 文章放入 Claude 或 Obsidian,你就知道這個問題 --- 從頁面複製會把雜訊一起拖來。

本指南涵蓋將 Substack 貼文轉換為乾淨 Markdown 的每種方法 --- 從單篇文章到帶嵌入音訊的付費牆長讀。

為什麼將 Substack 貼文儲存為 Markdown?

Markdown 是任何電子報需要去的地方都能運作的格式:

  • 封存你最喜愛的文章 --- 作者離開 Substack,貼文隱藏到付費牆後,帳戶被暫停。你的筆記不應該依賴於平台的可用性
  • 建立研究庫 --- 一個充滿乾淨 .md 檔案的資料夾可以在幾秒鐘內跨數百份電子報搜尋
  • 餵給 LLM --- Claude、ChatGPT、Gemini 和本地模型都原生讀取 Markdown 作為上下文
  • 逃脫平台鎖定 --- 付費訂閱買的是存取權,不是所有權。Markdown 給你已經付費的副本
  • 引用特定段落 --- 在 5,000 字的文章中找到「那段關於複利的段落」只需一次搜尋
  • 翻譯外語貼文 --- 一旦成為文字,任何翻譯工具都可以處理它

在 2026 年推動大部分 Substack 到 Markdown 流量的使用案例是前兩個:人們想要他們關心的文章的永久、可攜的副本,與平台解耦。

方法 1:Save(最快,一鍵)

Save 是一個 Chrome 擴充功能,可以一鍵將任何 Substack 貼文轉換為 Markdown 檔案。它直接從 DOM 讀取貼文內文,剝離每個訂閱模態和交叉推廣區塊,並生成讀起來像原始文章的東西,而不是抓取的頁面。

運作原理:

  1. 在 Chrome 中打開 Substack 貼文
  2. 點擊工具列中的 Save 擴充功能圖示
  3. .md 檔案立即下載(如果已連接,則降落在你的 Save Vault 中)

你得到的內容:

  • 貼文標題和副標題作為 Markdown 標題
  • 作者姓名、發佈日期和電子報名稱在 frontmatter 中
  • 完整內文,保留所有標題、引文和內聯圖片
  • 區塊引用保持為 > Markdown 引用,不渲染為頁面樣式
  • 嵌入的 Podcast 集數作為帶有原始 URL 的 Markdown 音訊參考
  • 註腳內聯在它們應屬於的位置
  • 包含標題、作者、電子報、發佈日期和規範 URL 的 frontmatter

被移除的內容:

  • 捲動中彈出的訂閱模態覆蓋層
  • 貼文頂部和底部的「From X’s Substack」交叉推廣區塊
  • 「Share this post」/ 「Pledge your support」/ 「Restack」行動號召橫幅
  • 頁尾註冊表單和推薦網格
  • Substack 導覽 chrome 和浮動閱讀進度條

**最適合:**研究人員、作家、任何擁有付費訂閱且真正想擁有的人、向 Claude 或 ChatGPT 提供上下文的 AI 使用者。如果你需要一篇要貼到 LLM 或在 Obsidian 中閱讀的乾淨文章,這是最乾淨的路徑。

輸出範例

儲存一篇 Packy McCormick 的文章產生:

---
title: "The Substack Renaissance"
subtitle: "How creator-led media is rebuilding the internet from the bottom up"
author: Packy McCormick
newsletter: Not Boring
url: https://www.notboring.co/p/the-substack-renaissance
date: 2026-02-14
---

# The Substack Renaissance

## How creator-led media is rebuilding the internet from the bottom up

Five years ago, the idea that a single writer could sustain a six-figure
business from a newsletter sounded absurd. Today there are hundreds of
them, and the model is starting to eat traditional media from the edges.

> "The best journalism of the next decade won't come from newsrooms.
> It'll come from one person, a Substack, and a community of 20,000
> readers who actually care."

## Why Now

Three things converged...

那個檔案距離成為可用的 Claude 上下文只差一次貼上,距離成為永久的 Obsidian 筆記只差一次按鍵。

方法 2:電子郵件 + 手動重新格式化

每個 Substack 貼文也會作為電子郵件投遞。你可以儲存電子郵件並手動將其轉換為 Markdown。

步驟:

  1. 在你的 Gmail 或 Apple Mail 中打開貼文
  2. 檢視原始碼或「顯示原文」,複製 HTML
  3. 透過 HTML 到 Markdown 轉換器執行它(Pandoc、turndown、html2md)
  4. 手動剝離頁首橫幅、頁尾註冊表單和交叉推廣區塊

此方法的問題:

  • Substack 電子郵件包裹在重的基於表格的 HTML 中,轉換為醜陋的 Markdown
  • 交叉推廣區塊(「Subscribe to X who also writes on Substack」)深度巢狀,難以用單個正則表達式剝離
  • 嵌入的 Podcast 作為內聯音訊播放器傳入,無法翻譯為 Markdown
  • 註腳在內文和電子郵件頁尾之間重複
  • 圖片由會過期的追蹤 URL 引用
  • 付費牆貼文作為截斷的預覽到達電子郵件,因此完整的文章甚至不在那裡

對單個短貼文可行。對任何長內容或付費內容都會崩潰。

方法 3:RSS feed + 腳本

每個公共 Substack 在 <newsletter>.substack.com/feed 都有一個 RSS feed。你可以輪詢它並將每個項目轉換為 Markdown。

curl https://newsletter.substack.com/feed | \
  pandoc -f html -t markdown -o post.md

**最適合:**大規模封存電子報的工程團隊,或任何建構自動化閱讀管道的人。需要腳本環境和 cron 任務。

此方法的問題:

  • RSS 只暴露免費貼文。付費牆文章不出現在 feed 中
  • feed 回傳電子郵件格式的 HTML,所以你繼承所有交叉推廣和註冊表單的雜訊
  • 頻道名稱之外沒有作者中繼資料 --- 客座貼文歸屬於電子報,而不是作者
  • 嵌入的 Podcast 從 RSS 有效負載中剝離
  • 引文失去樣式並與內文文字合併
  • 清理過程(移除訂閱區塊、修復圖片 URL)是單獨的步驟

如果你正在為你擁有權利的公共電子報建構管道,這是正確的方法。對單個貼文來說是過度的,而且無法觸及大多數讀者實際想要封存的付費內容。

方法 4:瀏覽器另存為(PDF)+ OCR

Chrome 的「另存為 PDF」適用於任何頁面,包括你已登入的付費牆 Substack 貼文。

步驟:

  1. 在 Chrome 中打開貼文
  2. Cmd+P,選擇「另存為 PDF」
  3. 透過 OCR 工具執行 PDF(Adobe Acrobat、Tesseract 或 pdftotext)
  4. 將輸出清理為 Markdown

Markdown 使用案例的問題:

  • 輸出是頁面格式,而不是文件格式 --- 標題失去其層次結構,段落跨頁面邊界斷開
  • 訂閱模態覆蓋層經常渲染 PDF 中,所以雜訊隨你而來
  • 引文、區塊引用和程式碼範例都失去其結構
  • 圖片作為像素烘焙到頁面中,而不是引用 --- 無法恢復原始圖片
  • OCR 在電子報的襯線重型排版上引入拼寫錯誤
  • 嵌入的 Podcast 和連結無法在 PDF 往返中存活

當沒有其他方法可以觸及內容時的最後手段方法。不是主要工作流程。

你應該使用哪種方法?

場景最佳方法
將 Substack 文章貼到 Claude 或 ChatGPT 中Save --- 一鍵、結構化輸出
封存你的付費訂閱Save --- 適用於你已登入的付費牆貼文
建立個人電子報研究庫Save --- 一致的 frontmatter,易於搜尋
大規模自動封存免費電子報RSS + 腳本 --- 可程式設計,但僅限免費貼文
僅電子郵件流程,手動分類電子郵件 + 重新格式化 --- 如果你每週只儲存 1-2 篇文章,可行
無法閱讀頁面的最後手段擷取另存為 PDF + OCR --- 嘈雜但總是有效

對於大多數人 --- 特別是任何有付費訂閱或使用 Substack 作為研究輸入的人 --- Save 是答案。它無需設定就能產生最乾淨的 Markdown,並且以與處理免費貼文相同的方式處理付費牆文章:從已登入瀏覽器能看到的任何內容。

Save 處理的邊緣情況

  • 付費牆貼文。 Save 看到你已登入瀏覽器看到的內容。如果你是付費訂閱者,你會得到完整的文章。如果不是,你會得到公共預覽,與頁面上顯示的完全一致。無破解、無抓取 --- 只是你已有存取權限內容的乾淨副本。
  • 交叉推廣區塊。 Substack 在大多數貼文的頂部和底部注入「From X’s Substack」推薦區塊。Save 自動剝離它們。匯出的 Markdown 只包含文章本身,歸屬於實際作者。
  • 嵌入的 Podcast 集數。 Substack 貼文越來越多地包含音訊。Save 將集數擷取為帶有原始 URL 的 Markdown 音訊參考,因此你可以稍後重新收聽或傳輸到轉錄工具。
  • 評論區。 頂層評論與評論者姓名和日期一起擷取。深度巢狀的執行緒被總結而不是原始傾倒,因此 400 條評論的討論不會膨脹檔案。
  • Threads(Substack 類 Twitter 功能)。 儲存為按時間順序的 Markdown 列表,帶有作者和時間戳記,與 Twitter 執行緒匯出形狀相同。
  • Notes。 Substack 的微貼文也可以運作。Markdown 較短但具有相同的 frontmatter 形狀,因此它們與同一資料夾中的長篇貼文並列。
  • 同一作者的多個電子報。 每個貼文在 frontmatter 中獲得其電子報名稱,因此在三個不同 Substack 上發佈的作者最終在三個可搜尋的桶中,無需手動標記。
  • 自訂網域。 許多 Substack 在自己的網域上執行(stratechery.comnotboring.conoahpinion.blog)。Save 無論 URL 如何都偵測到 Substack 驅動的後端並套用相同的乾淨匯出。
  • 圖片密集的貼文。 圖片仍由其原始 URL 引用,保留 alt 文字和說明。檔案保持小而便攜。

與你的工作流程配對

Markdown 輸出可在你需要的任何地方運作:

  • Claude / ChatGPT / Gemini --- 貼上檔案,詢問關於文章的後續問題
  • Obsidian --- 放入你的 vault,連結到相關筆記,跨所有已儲存的電子報搜尋
  • Notion --- 直接貼上,標題和引用正確渲染
  • Apple Notes --- 透過 Markdown 共享擴充功能乾淨匯入
  • Readwise / Reader --- Markdown 乾淨匯入,沒有來自原始 URL 儲存的交叉推廣和註冊雜訊
  • Save Vault --- 如果你連接了一個,每次 Substack 儲存自動降落在那裡,帶有反向連結和標籤

常見問題

Save 在付費牆 Substack 貼文上有效嗎? 是的,在你的帳戶有存取權限的貼文上。Save 讀取你已登入瀏覽器可以看到的內容。如果你是付費訂閱者,你會得到完整的文章。如果不是,你會得到公共預覽,與 Substack 向你顯示的完全一致。

Save 在自訂網域 Substack 上有效嗎? 是的。在自己的網域上執行的 Substack(Stratechery、Not Boring、Noahpinion)的匯出方式與 *.substack.com 站點相同。擴充功能偵測到 Substack 驅動的後端。

我可以儲存 Substack Notes 和 Threads 嗎? 是的。Notes 匯出為短的 Markdown 檔案。Threads 匯出為按時間順序的 Markdown 列表,每個項目帶有作者和時間戳記。

評論區怎麼辦? 頂層評論與評論者的姓名和日期一起擷取。深度巢狀的執行緒被總結以保持檔案可讀。如果你想要每條評論的逐字版本,這是擴充功能設定中的一行選項。

Save 是否剝離「Subscribe now」模態和交叉推廣區塊? 是的。訂閱模態覆蓋層、「From X’s Substack」交叉推廣區塊、「Pledge your support」橫幅和頁尾註冊表單都被移除。匯出的 Markdown 只包含貼文本身。

它保留圖片和引文嗎? 是的。圖片透過其原始 URL 引用,alt 文字和說明完好。引文匯出為 Markdown 區塊引用(>)。

嵌入的 Podcast 集數怎麼辦? 擷取為帶有原始集數 URL 的 Markdown 音訊參考。如果你想要轉錄,之後將 URL 傳送到你選擇的轉錄工具。

儲存 Substack 貼文是否與任何人共享我的帳戶? 不。擴充功能在你的瀏覽器中本地執行。它以與你的瀏覽器相同的方式讀取貼文,並將 Markdown 寫入你的機器。沒有登入資料離開你的電腦。

它要多少錢? Save 有一個免費層,所以你可以在幾個貼文上試用。之後,小額訂閱涵蓋持續使用。

相關 Save 指南

## Continue reading

Jean-Sébastien Wallez

Written by

Jean-Sébastien Wallez

I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.