如何將 Substack 貼文儲存為 Markdown(支援付費牆,無交叉推廣)
Substack 不希望你帶著內容離開。沒有原生匯出、沒有「下載此貼文」按鈕、沒有公共 API 讓付費訂閱者備份他們已付費的文章。你打開的每一篇貼文都被訂閱模態覆蓋層、網路中其他電子報的交叉推廣區塊,以及哀求郵件地址的頁尾所包圍。如果你曾試圖將 Substack 文章放入 Claude 或 Obsidian,你就知道這個問題 --- 從頁面複製會把雜訊一起拖來。
本指南涵蓋將 Substack 貼文轉換為乾淨 Markdown 的每種方法 --- 從單篇文章到帶嵌入音訊的付費牆長讀。
為什麼將 Substack 貼文儲存為 Markdown?
Markdown 是任何電子報需要去的地方都能運作的格式:
- 封存你最喜愛的文章 --- 作者離開 Substack,貼文隱藏到付費牆後,帳戶被暫停。你的筆記不應該依賴於平台的可用性
- 建立研究庫 --- 一個充滿乾淨
.md檔案的資料夾可以在幾秒鐘內跨數百份電子報搜尋 - 餵給 LLM --- Claude、ChatGPT、Gemini 和本地模型都原生讀取 Markdown 作為上下文
- 逃脫平台鎖定 --- 付費訂閱買的是存取權,不是所有權。Markdown 給你已經付費的副本
- 引用特定段落 --- 在 5,000 字的文章中找到「那段關於複利的段落」只需一次搜尋
- 翻譯外語貼文 --- 一旦成為文字,任何翻譯工具都可以處理它
在 2026 年推動大部分 Substack 到 Markdown 流量的使用案例是前兩個:人們想要他們關心的文章的永久、可攜的副本,與平台解耦。
方法 1:Save(最快,一鍵)
Save 是一個 Chrome 擴充功能,可以一鍵將任何 Substack 貼文轉換為 Markdown 檔案。它直接從 DOM 讀取貼文內文,剝離每個訂閱模態和交叉推廣區塊,並生成讀起來像原始文章的東西,而不是抓取的頁面。
運作原理:
- 在 Chrome 中打開 Substack 貼文
- 點擊工具列中的 Save 擴充功能圖示
.md檔案立即下載(如果已連接,則降落在你的 Save Vault 中)
你得到的內容:
- 貼文標題和副標題作為 Markdown 標題
- 作者姓名、發佈日期和電子報名稱在 frontmatter 中
- 完整內文,保留所有標題、引文和內聯圖片
- 區塊引用保持為
>Markdown 引用,不渲染為頁面樣式 - 嵌入的 Podcast 集數作為帶有原始 URL 的 Markdown 音訊參考
- 註腳內聯在它們應屬於的位置
- 包含標題、作者、電子報、發佈日期和規範 URL 的 frontmatter
被移除的內容:
- 捲動中彈出的訂閱模態覆蓋層
- 貼文頂部和底部的「From X’s Substack」交叉推廣區塊
- 「Share this post」/ 「Pledge your support」/ 「Restack」行動號召橫幅
- 頁尾註冊表單和推薦網格
- Substack 導覽 chrome 和浮動閱讀進度條
**最適合:**研究人員、作家、任何擁有付費訂閱且真正想擁有的人、向 Claude 或 ChatGPT 提供上下文的 AI 使用者。如果你需要一篇要貼到 LLM 或在 Obsidian 中閱讀的乾淨文章,這是最乾淨的路徑。
輸出範例
儲存一篇 Packy McCormick 的文章產生:
---
title: "The Substack Renaissance"
subtitle: "How creator-led media is rebuilding the internet from the bottom up"
author: Packy McCormick
newsletter: Not Boring
url: https://www.notboring.co/p/the-substack-renaissance
date: 2026-02-14
---
# The Substack Renaissance
## How creator-led media is rebuilding the internet from the bottom up
Five years ago, the idea that a single writer could sustain a six-figure
business from a newsletter sounded absurd. Today there are hundreds of
them, and the model is starting to eat traditional media from the edges.
> "The best journalism of the next decade won't come from newsrooms.
> It'll come from one person, a Substack, and a community of 20,000
> readers who actually care."
## Why Now
Three things converged...
那個檔案距離成為可用的 Claude 上下文只差一次貼上,距離成為永久的 Obsidian 筆記只差一次按鍵。
方法 2:電子郵件 + 手動重新格式化
每個 Substack 貼文也會作為電子郵件投遞。你可以儲存電子郵件並手動將其轉換為 Markdown。
步驟:
- 在你的 Gmail 或 Apple Mail 中打開貼文
- 檢視原始碼或「顯示原文」,複製 HTML
- 透過 HTML 到 Markdown 轉換器執行它(Pandoc、turndown、html2md)
- 手動剝離頁首橫幅、頁尾註冊表單和交叉推廣區塊
此方法的問題:
- Substack 電子郵件包裹在重的基於表格的 HTML 中,轉換為醜陋的 Markdown
- 交叉推廣區塊(「Subscribe to X who also writes on Substack」)深度巢狀,難以用單個正則表達式剝離
- 嵌入的 Podcast 作為內聯音訊播放器傳入,無法翻譯為 Markdown
- 註腳在內文和電子郵件頁尾之間重複
- 圖片由會過期的追蹤 URL 引用
- 付費牆貼文作為截斷的預覽到達電子郵件,因此完整的文章甚至不在那裡
對單個短貼文可行。對任何長內容或付費內容都會崩潰。
方法 3:RSS feed + 腳本
每個公共 Substack 在 <newsletter>.substack.com/feed 都有一個 RSS feed。你可以輪詢它並將每個項目轉換為 Markdown。
curl https://newsletter.substack.com/feed | \
pandoc -f html -t markdown -o post.md
**最適合:**大規模封存電子報的工程團隊,或任何建構自動化閱讀管道的人。需要腳本環境和 cron 任務。
此方法的問題:
- RSS 只暴露免費貼文。付費牆文章不出現在 feed 中
- feed 回傳電子郵件格式的 HTML,所以你繼承所有交叉推廣和註冊表單的雜訊
- 頻道名稱之外沒有作者中繼資料 --- 客座貼文歸屬於電子報,而不是作者
- 嵌入的 Podcast 從 RSS 有效負載中剝離
- 引文失去樣式並與內文文字合併
- 清理過程(移除訂閱區塊、修復圖片 URL)是單獨的步驟
如果你正在為你擁有權利的公共電子報建構管道,這是正確的方法。對單個貼文來說是過度的,而且無法觸及大多數讀者實際想要封存的付費內容。
方法 4:瀏覽器另存為(PDF)+ OCR
Chrome 的「另存為 PDF」適用於任何頁面,包括你已登入的付費牆 Substack 貼文。
步驟:
- 在 Chrome 中打開貼文
Cmd+P,選擇「另存為 PDF」- 透過 OCR 工具執行 PDF(Adobe Acrobat、Tesseract 或
pdftotext) - 將輸出清理為 Markdown
Markdown 使用案例的問題:
- 輸出是頁面格式,而不是文件格式 --- 標題失去其層次結構,段落跨頁面邊界斷開
- 訂閱模態覆蓋層經常渲染到 PDF 中,所以雜訊隨你而來
- 引文、區塊引用和程式碼範例都失去其結構
- 圖片作為像素烘焙到頁面中,而不是引用 --- 無法恢復原始圖片
- OCR 在電子報的襯線重型排版上引入拼寫錯誤
- 嵌入的 Podcast 和連結無法在 PDF 往返中存活
當沒有其他方法可以觸及內容時的最後手段方法。不是主要工作流程。
你應該使用哪種方法?
| 場景 | 最佳方法 |
|---|---|
| 將 Substack 文章貼到 Claude 或 ChatGPT 中 | Save --- 一鍵、結構化輸出 |
| 封存你的付費訂閱 | Save --- 適用於你已登入的付費牆貼文 |
| 建立個人電子報研究庫 | Save --- 一致的 frontmatter,易於搜尋 |
| 大規模自動封存免費電子報 | RSS + 腳本 --- 可程式設計,但僅限免費貼文 |
| 僅電子郵件流程,手動分類 | 電子郵件 + 重新格式化 --- 如果你每週只儲存 1-2 篇文章,可行 |
| 無法閱讀頁面的最後手段擷取 | 另存為 PDF + OCR --- 嘈雜但總是有效 |
對於大多數人 --- 特別是任何有付費訂閱或使用 Substack 作為研究輸入的人 --- Save 是答案。它無需設定就能產生最乾淨的 Markdown,並且以與處理免費貼文相同的方式處理付費牆文章:從已登入瀏覽器能看到的任何內容。
Save 處理的邊緣情況
- 付費牆貼文。 Save 看到你已登入瀏覽器看到的內容。如果你是付費訂閱者,你會得到完整的文章。如果不是,你會得到公共預覽,與頁面上顯示的完全一致。無破解、無抓取 --- 只是你已有存取權限內容的乾淨副本。
- 交叉推廣區塊。 Substack 在大多數貼文的頂部和底部注入「From X’s Substack」推薦區塊。Save 自動剝離它們。匯出的 Markdown 只包含文章本身,歸屬於實際作者。
- 嵌入的 Podcast 集數。 Substack 貼文越來越多地包含音訊。Save 將集數擷取為帶有原始 URL 的 Markdown 音訊參考,因此你可以稍後重新收聽或傳輸到轉錄工具。
- 評論區。 頂層評論與評論者姓名和日期一起擷取。深度巢狀的執行緒被總結而不是原始傾倒,因此 400 條評論的討論不會膨脹檔案。
- Threads(Substack 類 Twitter 功能)。 儲存為按時間順序的 Markdown 列表,帶有作者和時間戳記,與 Twitter 執行緒匯出形狀相同。
- Notes。 Substack 的微貼文也可以運作。Markdown 較短但具有相同的 frontmatter 形狀,因此它們與同一資料夾中的長篇貼文並列。
- 同一作者的多個電子報。 每個貼文在 frontmatter 中獲得其電子報名稱,因此在三個不同 Substack 上發佈的作者最終在三個可搜尋的桶中,無需手動標記。
- 自訂網域。 許多 Substack 在自己的網域上執行(
stratechery.com、notboring.co、noahpinion.blog)。Save 無論 URL 如何都偵測到 Substack 驅動的後端並套用相同的乾淨匯出。 - 圖片密集的貼文。 圖片仍由其原始 URL 引用,保留 alt 文字和說明。檔案保持小而便攜。
與你的工作流程配對
Markdown 輸出可在你需要的任何地方運作:
- Claude / ChatGPT / Gemini --- 貼上檔案,詢問關於文章的後續問題
- Obsidian --- 放入你的 vault,連結到相關筆記,跨所有已儲存的電子報搜尋
- Notion --- 直接貼上,標題和引用正確渲染
- Apple Notes --- 透過 Markdown 共享擴充功能乾淨匯入
- Readwise / Reader --- Markdown 乾淨匯入,沒有來自原始 URL 儲存的交叉推廣和註冊雜訊
- Save Vault --- 如果你連接了一個,每次 Substack 儲存自動降落在那裡,帶有反向連結和標籤
常見問題
Save 在付費牆 Substack 貼文上有效嗎? 是的,在你的帳戶有存取權限的貼文上。Save 讀取你已登入瀏覽器可以看到的內容。如果你是付費訂閱者,你會得到完整的文章。如果不是,你會得到公共預覽,與 Substack 向你顯示的完全一致。
Save 在自訂網域 Substack 上有效嗎?
是的。在自己的網域上執行的 Substack(Stratechery、Not Boring、Noahpinion)的匯出方式與 *.substack.com 站點相同。擴充功能偵測到 Substack 驅動的後端。
我可以儲存 Substack Notes 和 Threads 嗎? 是的。Notes 匯出為短的 Markdown 檔案。Threads 匯出為按時間順序的 Markdown 列表,每個項目帶有作者和時間戳記。
評論區怎麼辦? 頂層評論與評論者的姓名和日期一起擷取。深度巢狀的執行緒被總結以保持檔案可讀。如果你想要每條評論的逐字版本,這是擴充功能設定中的一行選項。
Save 是否剝離「Subscribe now」模態和交叉推廣區塊? 是的。訂閱模態覆蓋層、「From X’s Substack」交叉推廣區塊、「Pledge your support」橫幅和頁尾註冊表單都被移除。匯出的 Markdown 只包含貼文本身。
它保留圖片和引文嗎?
是的。圖片透過其原始 URL 引用,alt 文字和說明完好。引文匯出為 Markdown 區塊引用(>)。
嵌入的 Podcast 集數怎麼辦? 擷取為帶有原始集數 URL 的 Markdown 音訊參考。如果你想要轉錄,之後將 URL 傳送到你選擇的轉錄工具。
儲存 Substack 貼文是否與任何人共享我的帳戶? 不。擴充功能在你的瀏覽器中本地執行。它以與你的瀏覽器相同的方式讀取貼文,並將 Markdown 寫入你的機器。沒有登入資料離開你的電腦。
它要多少錢? Save 有一個免費層,所以你可以在幾個貼文上試用。之後,小額訂閱涵蓋持續使用。
相關 Save 指南
- 將 Medium 文章儲存為 Markdown --- 你在無痕模式下打開的付費牆貼文,乾淨擷取
- 將 YouTube 影片儲存為 Markdown --- 轉錄、摘要、時間戳記,都在一個檔案中
- 將 Twitter / X 執行緒儲存為 Markdown --- 每條推文,按順序,帶歸屬
- 將 Notion 頁面儲存為 Markdown --- 展開的摺疊,作為表格的資料庫
## Continue reading
如何將 Claude 對話儲存為 Markdown(Artifacts、引用、Projects)
將 Claude 對話轉換為乾淨的 Markdown:每個回合、Artifacts 作為程式碼區塊、保留引用。給研究者與 AI 使用者的完整指南。
如何將 ChatGPT 對話儲存為 Markdown(每輪對話、程式碼區塊完整保留)
將任何 ChatGPT 對話轉換為乾淨的 Markdown:每輪對話、程式碼區塊、表格、引用。給研究者和 AI 使用者的 2026 完整指南。
如何將 Reddit 串文儲存為 Markdown(含留言與上下文)
將任何 Reddit 串文轉換為乾淨的 Markdown,保留巢狀留言、karma、flair 和 OP 標記。2026 年研究人員與 AI 使用者完整指南。
如何將 Twitter / X 串文儲存為 Markdown(完整串文,按順序)
將任何 Twitter 或 X 串文轉換為乾淨的 Markdown:每則推文按發佈順序排列,附署名、時間戳和巢狀引用推文。2026 指南。
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.