如何將 Reddit 串文儲存為 Markdown(含留言與上下文)
Reddit 是真正答案存在的地方 --- 真正解決你問題的故障排除串文、四年前埋藏的 AMA、專家聚集的小眾 subreddit。但 Reddit 沒給你任何可以帶走的東西。沒有匯出、沒有「另存新檔」按鈕、沒有辦法把一個串文連同它的留言上下文完整地拉出來。複製貼上會壓平巢狀結構並剝離 karma。如果你曾經試圖把 Reddit 串文丟給 Claude 或 ChatGPT,你就知道這個問題 --- 貼 URL 模型什麼都得不到,貼可見文字則會失去使該串文值得閱讀的結構。
本指南涵蓋了將 Reddit 串文轉換為乾淨 Markdown 的所有方法 --- 從一個簡短的問題貼到 2,000 則留言的 AMA。
為什麼要把 Reddit 串文儲存為 Markdown?
Reddit 的內容獨特地脆弱,作為研究材料又獨特地寶貴:
- 餵給 LLM --- Claude、ChatGPT、Gemini 和本地模型都原生地把 Markdown 當作上下文來讀取
- 在消失前歸檔 --- 使用者會摧毀帳戶、版主會移除貼文、subreddit 會一夜之間變成私密
- 引用特定的留言鏈 --- 答案很少是最熱門留言,通常在三層回覆之下
- 拖進 Obsidian 或 Notion --- 一個檔案、完全可搜尋、討論結構完整
- 建立個人知識庫 --- 產品推薦、故障排除、AMA、小眾專長
2026 年驅動大部分 Reddit-到-Markdown 流量的使用案例是第一個:人們想讓 LLM 總結一條 500 則留言的串文、找到共識答案,或抽取最高讚推薦。貼 URL 不工作,貼原始 HTML 又會淹沒上下文視窗。
方法 1:Save(最快,一鍵)
Save 是一個 Chrome 擴充功能,能一鍵把任何 Reddit 串文變成一個 Markdown 檔案。它遍歷留言樹、保留巢狀結構,產生一個讀起來像結構化討論而非文字牆的檔案。
運作方式:
- 在 Chrome 中開啟 Reddit 串文(在
old.reddit.com和www.reddit.com上都運作) - 點擊工具列中的 Save 擴充功能圖示
- 一個
.md檔案立刻下載(如果連接了 Save Vault,則落入其中)
你得到什麼:
- 頂部的原貼正文、標題、subreddit、作者和分數
- 評分最高的留言分支,完整保留回覆巢狀
- 每則留言的 karma 分數、flair 和 OP 標記
- 包含 URL、subreddit、貼文日期和總留言數的 frontmatter
- 整個串文在一個檔案裡 --- 貼文和留言一起,而不是兩個匯出
被移除的內容:
- 側欄元件、subreddit 規則、推薦貼文
- 推廣貼文和留言之間的廣告位
- Reddit 的導覽 chrome、頁尾和「What are your thoughts?」提示
- AutoModerator 的置頂留言(除非明確啟用)
- 已刪除/被移除的留言正文(替換為佔位符,使串文結構保持可讀)
最適合: 研究人員、AI 使用者,任何把 Reddit 當作嚴肅知識來源的人。如果你需要一個乾淨的串文貼到 Claude 或在 Obsidian 中閱讀,這是最乾淨的路徑。殺手級功能是留言巢狀 --- 複製貼上會摧毀它,其他每種方法都會丟失它,Save 保留它。
輸出範例
儲存一則熱門的 r/selfhosted 串文會產生:
---
title: "What's your favorite self-hosted app that nobody talks about?"
subreddit: r/selfhosted
author: u/homelabdad
url: https://www.reddit.com/r/selfhosted/comments/abc123/...
score: 1247
comments: 384
date: 2026-03-12
---
## Post
I've been running a homelab for 5 years and the apps that get all the
attention (Plex, Home Assistant, Nextcloud) are great, but the ones I
actually rely on every day are tiny tools nobody mentions. What's yours?
## Top Comments
### u/devops_anna --- 892 points
[Mealie](https://mealie.io) is criminally underrated. Recipe manager
that scrapes from any URL, meal planning, shopping lists. Replaced
three apps for me.
- **u/homelabdad** (OP) --- 124 points
> Just installed it after seeing this. The URL scraper is magic.
- **u/recipe_hoarder** --- 67 points
> Been using it 2 years. The Nextcloud integration is solid too.
### u/raspberry_pi_4 --- 654 points
**Beszel** for monitoring. Lighter than Grafana, prettier than Uptime
Kuma, zero config. Single binary on every host.
- **u/devops_anna** --- 203 points
> Switched from Netdata last month. No regrets.
那個檔案距離成為可用的 Claude 上下文只差一次貼上,距離成為永久 Obsidian 筆記只差一次按鍵。巢狀在任何 Markdown 檢視器中都能正確渲染,karma 分數讓哪些分支重要變得一目了然。
方法 2:Reddit 的原生匯出(有限)
Reddit 允許你透過 Settings → Privacy & Security → Request Data 請求自己帳戶活動的資料匯出。
步驟:
- 前往 reddit.com/settings/data-request
- 提交 GDPR 或 CCPA 請求
- 等待最多 30 天收到帶下載連結的郵件
- 收到一個 CSV 檔案的 ZIP
這種方法的問題:
- 只涵蓋你自己的活動(你發的貼文、你寫的留言、你儲存的項目)
- 你無法匯出別人的串文或 AMA
- 輸出是 CSV,不是 Markdown --- 沒有結構、沒有巢狀,只是行
- 留言正文被扁平地傾倒,沒有父子關係
- 30 天等待讓它對活躍研究毫無用處
- 不支援在上下文中匯出單個串文
恰好用一次有用,當你想備份自己的 Reddit 歷史時。對其他一切都無用。
方法 3:PRAW 或 Reddit API
對於工程團隊,Reddit 的官方 API(以及其優秀的 Python 包裝器 PRAW)讓你能以程式化方式拉取任何串文。
import praw
reddit = praw.Reddit(client_id="...", client_secret="...", user_agent="...")
submission = reddit.submission(url="https://reddit.com/r/.../comments/...")
submission.comments.replace_more(limit=None)
for comment in submission.comments.list():
print(comment.author, comment.score, comment.body)
最適合: 建構 Reddit 攝取管線、訓練資料集或大規模研究爬蟲的工程團隊。
這種方法的問題:
- Reddit API 現在需要註冊並強制執行嚴格的速率限制(自 2023 年變更以來)
- 免費層每個 OAuth 客戶端每分鐘上限 100 個查詢,對帶
replace_more的深層串文很苛刻 - 沒有 Markdown 格式 --- 你得到原始文字,沒有巢狀結構,沒有 Reddit 自身 Markdown 的渲染
- 從扁平留言列表建構樹是單獨的一步
- 商業 / 大流量使用需要與 Reddit 的付費協議
如果你在建構產品,這是正確的方法。對一個串文來說極度過度。
方法 4:瀏覽器複製 + Pandoc
手動後備方案:從瀏覽器複製渲染後的串文並重新格式化。
# After copying the thread to a file as HTML:
pandoc thread.html -f html -t markdown -o thread.md
最適合: 在沒有安裝任何工具時,對你絕對現在需要的一個串文的一次性救援。
這種方法的問題:
- 從 Reddit 複製貼上會壓平巢狀 --- Pandoc 無法恢復 Chrome 未包含的內容
- Karma 分數、flair、OP 標記和時間戳作為視覺雜訊內聯落入
- 「Load more comments」展開需要在複製前手動進行
- 圖片貼、投票和影片貼完全丟失內容
- 輸出需要大量手動編輯才能可用
在短串文上緊急時能工作。任何有深度的內容都會崩塌。
你應該使用哪種方法?
| 情境 | 最佳方法 |
|---|---|
| 把串文貼到 Claude 或 ChatGPT | Save --- 一鍵,巢狀保留 |
| 在鎖定前歸檔長 AMA | Save --- 在一個檔案中捕獲整個樹 |
| 在研究筆記中引用特定留言鏈 | Save --- karma + flair + OP 標記完整 |
| 建構內部 Reddit 攝取管線 | PRAW --- 程式化,手握 API 金鑰 |
| 備份自己的 Reddit 歷史 | Reddit 資料匯出 --- 唯一能給你自己資料的方法 |
| 在沒有工具時救援單個串文 | 複製 + Pandoc --- 手動但離線運作 |
對大多數人來說 --- 尤其是任何把 Reddit 當作 AI 上下文或研究材料的人 --- Save 就是答案。它在零設定下產生最乾淨的 Markdown,處理 2,000 則留言的 AMA 與五則留言的貼文速度相同。
Save 處理的邊界情況
- 永久連結到特定留言。 如果你開啟像
/comments/abc/_/xyz/這樣的 URL,Reddit 只顯示那條留言和它的回覆。Save 尊重這一點 --- 它從那個錨點向下捕獲留言子樹,而不是整個串文。當你想要的答案在六層深時很有用。 - 非常深的留言串。 Reddit 用「continue this thread」摺疊超過一定深度的串文。Save 跟隨這些連結並把深層分支縫合回去,縮排保持在 Markdown 中可讀。在極端情況下(10+ 層),它切換到帶麵包屑的扁平格式,這樣檔案不會變成水平捲動條。
- 已刪除和被移除的留言。 當一條留言顯示
[deleted]或[removed]時,Save 保留佔位符讓樹結構保持完整。下方的回覆鏈被保留 --- 即使原始留言消失,你仍然可以讀回覆。 - old.reddit.com vs new.reddit.com。 兩種版面都運作。Save 自動偵測你在哪個上並相應解析。
old.reddit因為 DOM 更簡單而傾向於給出略乾淨的輸出,但new.reddit也運作得很好。 - 私密和受限的 subreddit。 Save 看到你已登入瀏覽器看到的內容。如果你在一個私密 sub 中被批准,Save 可以在那裡捕獲串文。如果你看不見,Save 也看不見。
- 已歸檔的串文。 Reddit 在 6 個月後歸檔串文並鎖定新留言。Save 同樣地捕獲它們 --- 歸檔狀態不改變解析。
- 投票和圖片貼。 投票結果(目前票數、選項)作為列表捕獲。圖片貼在 frontmatter 中包含圖片 URL 和替代文字。影片貼包含影片 URL 和 Reddit 產生的自動轉錄(如果有的話)。
- 跨貼。 當一個串文是跨貼時,Save 連結到原始並捕獲在目前跨貼上發生的討論,而不是來源貼上的。
與你的工作流搭配
Markdown 輸出在你需要的任何地方運作:
- Claude / ChatGPT / Gemini --- 貼上檔案,問後續問題如「共識的產品選擇是什麼?」或「總結前三個故障排除路徑」
- Obsidian --- 放入你的 vault,連結到相關筆記,跨你儲存的某個主題的每個串文搜尋
- Notion --- 直接貼上,巢狀留言結構渲染為切換
- Apple Notes --- 透過 Markdown 共享擴充功能乾淨匯入
- Save Vault --- 如果你連接了一個,每次 Reddit 儲存都會自動落在那裡,帶反向連結和 subreddit 標籤
常見問題
Save 在 Reddit 行動網站或應用程式上運作嗎? 擴充功能目前僅支援桌面 Chrome。在行動端,複製 URL 並在桌面開啟,或共享到 Mac 上的 Save Vault(它有 URL 處理器)。
那帶無限捲動留言的新 Reddit 重新設計呢? Save 同時處理經典和重新設計的版面。在新 Reddit 上,它在解析前自動觸發「load more comments」展開,所以你不必先捲動整個串文。
我可以只儲存原貼,不儲存留言嗎? 可以。擴充功能讓你選擇:僅貼文、貼文 + 頂部留言,或完整串文。預設是貼文 + 頂部留言,因為通常這就是你實際想要的。
它在留言中保留 Reddit Markdown 格式嗎? 是的。留言中的粗體、斜體、連結、程式碼區塊、引用和列表在輸出中保持為 Markdown --- 它們在 Reddit 那邊本來就是 Markdown。
它如何處理數千則留言的串文? Save 先捕獲評分最高的分支,按分數往下走。在一條 2,000 則留言的 AMA 上,預設輸出保留前 200 條左右的留言鏈 --- 那些 karma 在閾值之上的。如果你想要全部或只想要最頂端,可以在擴充功能設定中設定深度和閾值。
那 NSFW 串文呢? Save 與任何其他串文一樣捕獲它們 --- 它不按 NSFW 標籤過濾。如果你能看到串文,Save 就能儲存它。
儲存時 karma 分數準確嗎? 是的,分數在你點擊 Save 的那一刻被捕獲。Reddit 在頁面上模糊地舍入大分數(「12.4k」);當 API 公開時 Save 使用精確整數,否則保留顯示的舍入值。
多少錢? Save 有免費層讓你能在幾個串文上試用。之後,一個小訂閱涵蓋解析和儲存成本。
相關 Save 指南
- Save YouTube Videos as Markdown --- AI 轉錄、摘要、時間戳
- Save Twitter / X Threads as Markdown --- 每則推文,按順序,帶歸屬
- Save Hacker News Threads as Markdown --- 巢狀討論,karma 完整
- Save ChatGPT Conversations as Markdown --- 每個回合,程式碼區塊完整
## Continue reading
如何將 ChatGPT 對話儲存為 Markdown(每輪對話、程式碼區塊完整保留)
將任何 ChatGPT 對話轉換為乾淨的 Markdown:每輪對話、程式碼區塊、表格、引用。給研究者和 AI 使用者的 2026 完整指南。
如何將 Twitter / X 串文儲存為 Markdown(完整串文,按順序)
將任何 Twitter 或 X 串文轉換為乾淨的 Markdown:每則推文按發佈順序排列,附署名、時間戳和巢狀引用推文。2026 指南。
如何將 YouTube 影片儲存為 Markdown(逐字稿、摘要、時間戳)
把任何 YouTube 影片轉成乾淨的 Markdown:AI 逐字稿、摘要、時間戳、章節標記。給研究者與 AI 使用者的 2026 完整指南。
如何將 Claude 對話儲存為 Markdown(Artifacts、引用、Projects)
將 Claude 對話轉換為乾淨的 Markdown:每個回合、Artifacts 作為程式碼區塊、保留引用。給研究者與 AI 使用者的完整指南。
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.