← 返回部落格

如何將任何網頁儲存為 Markdown(3 種方法)

· Save Team
markdownweb-clipperhow-toproductivity

您想將網頁儲存為 Markdown 檔案。也許您正在建立知識庫、存檔文件,或者只是想要一篇文章的乾淨副本。以下是三種方法,從最簡單到最技術性。

方法 1:Save 擴充功能(最簡單)

Save 是一個 Chrome 擴充功能,一鍵將任何網頁轉換為乾淨的 Markdown。

運作方式:

  1. 從 Chrome Web Store 安裝 Save
  2. 前往任何網頁
  3. 點擊 Save 圖示
  4. 一個 .md 檔案下載到您的電腦

使它優秀的地方:

  • AI 驅動的提取去除廣告、導覽和雜亂內容
  • 保留標題、清單、程式碼區塊、表格和連結
  • 適用於困難頁面:YouTube(完整逐字稿)、Twitter 串文、Reddit、Confluence、付費牆內容
  • 不需要終端機、API 金鑰或設定
  • 輸出是乾淨、結構化的 Markdown,可直接用於 Obsidian、VS Code 或 AI 工具

最適合: 任何想要乾淨 Markdown 而不需要接觸終端機的人。

方法 2:命令列工具

幾個 CLI 工具可以將 HTML 轉換為 Markdown:

Pandoc

文件轉換的瑞士軍刀:

# 從 URL(取得 + 轉換)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md

# 從本地 HTML 檔案
pandoc input.html -o output.md

優點: 強大,處理複雜文件,多種輸出格式。 缺點: 取得原始 HTML(包含導覽、廣告、腳本)。輸出通常需要手動清理。

Defuddle

專注於提取可讀內容的新工具:

npm install -g defuddle
defuddle parse https://example.com/article --md

優點: 去除導覽和雜亂內容,專注於文章內容。 缺點: 需要 Node.js,不能處理所有頁面類型。

Jina Reader

透過 HTTP 回傳 Markdown 的託管 API:

curl -s "https://r.jina.ai/https://example.com/article"

優點: 無需安裝,透過 HTTP 使用。 缺點: 有速率限制,需要網路,第三方依賴,不能很好地處理 JavaScript 渲染的頁面。

最適合: 熟悉終端機且需要批量轉換頁面的開發者。

方法 3:手動複製貼上

低技術方法:

  1. 選取頁面上的所有內容(Cmd+A 或 Ctrl+A)
  2. 複製(Cmd+C 或 Ctrl+C)
  3. 貼入 Markdown 編輯器
  4. 手動修復格式

優點: 不需要工具。 缺點: 複製一切(導覽、廣告、頁尾)。失去格式。表格損壞。程式碼區塊消失。連結變成純文字。對於短文章以外的任何內容都很費時。

最適合: 只需要幾段文字的一次性儲存。

比較

功能Save 擴充功能CLI 工具複製貼上
設定時間10 秒5-30 分鐘
一鍵儲存
乾淨輸出AI 提取不一定手動清理
YouTube 逐字稿
Twitter 串文部分
Confluence/Wiki部分混亂
程式碼區塊保留通常
表格保留通常
離線使用是(Pandoc)
費用提供免費層免費免費

為什麼要將網頁儲存為 Markdown?

如果您在閱讀這篇文章,您可能已經知道了。但以下是為什麼 Markdown 比其他格式更適合儲存網頁內容:

它很小。 一篇典型的文章以 Markdown 格式是 5KB,而 HTML 格式則超過 100KB。那是 20 倍更少的儲存空間,如果您提供給 AI,則是 20 倍更少的 token。

它是可攜帶的。 在任何文字編輯器、任何筆記應用程式(Obsidian、Notion、Logseq)或任何開發者工具中開啟它。沒有廠商鎖定。

它是可搜尋的。 在幾毫秒內對數百個 Markdown 檔案進行 grep 搜尋。試試對 PDF 做這件事。

LLM 喜歡它。 Claude、ChatGPT 和其他 AI 工具是用數百萬個 Markdown 文件訓練的。提供給它們 Markdown 比原始 HTML 或 PDF 產生更好的結果。

它永久保存。 純文字檔案是最耐用的數位格式。您的 .md 檔案在 50 年後仍可讀取。您的書籤活不過 5 年。

開始使用

開始將網頁儲存為 Markdown 的最快方式:從 Chrome Web Store 安裝 Save。免費開始,安裝只需 10 秒。


再也不要遺失網頁。Save 一鍵將任何頁面轉換為乾淨的 Markdown。