← Zurück zum Blog

Webseiten als Markdown speichern – so geht's (3 Methoden)

· Save Team
markdownweb-clipperhow-toproductivity

Du möchtest eine Webseite als Markdown-Datei speichern. Vielleicht baust du eine Wissensdatenbank auf, archivierst Dokumentation, oder willst einfach eine saubere Kopie eines Artikels. Hier sind drei Möglichkeiten – von der einfachsten bis zur technischsten.

Methode 1: Save-Erweiterung (am einfachsten)

Save ist eine Chrome-Erweiterung, die jede Webseite mit einem Klick in sauberes Markdown konvertiert.

So funktioniert es:

  1. Save aus dem Chrome Web Store installieren
  2. Eine beliebige Webseite besuchen
  3. Das Save-Symbol anklicken
  4. Eine .md-Datei wird auf deinen Computer heruntergeladen

Was sie gut macht:

  • KI-gestützte Extraktion entfernt Anzeigen, Navigation und Überflüssiges
  • Bewahrt Überschriften, Listen, Codeblöcke, Tabellen und Links
  • Funktioniert auf schwierigen Seiten: YouTube (vollständige Transkripte), Twitter-Threads, Reddit, Confluence, kostenpflichtige Inhalte
  • Kein Terminal, keine API-Schlüssel, keine Konfiguration
  • Die Ausgabe ist sauberes, strukturiertes Markdown, fertig für Obsidian, VS Code oder KI-Tools

Am besten für: Alle, die sauberes Markdown wollen, ohne ein Terminal anzufassen.

Methode 2: Kommandozeilen-Tools

Mehrere CLI-Tools konvertieren HTML in Markdown:

Pandoc

Das Schweizer Taschenmesser der Dokumentenkonvertierung:

# Von einer URL (abrufen + konvertieren)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md

# Von einer lokalen HTML-Datei
pandoc input.html -o output.md

Vorteile: Leistungsstark, verarbeitet komplexe Dokumente, viele Ausgabeformate. Nachteile: Ruft rohes HTML ab (enthält Navigation, Anzeigen, Scripts). Ausgabe braucht oft manuelle Bereinigung.

Defuddle

Ein neueres Tool, das sich auf die Extraktion von lesbarem Inhalt konzentriert:

npm install -g defuddle
defuddle parse https://example.com/article --md

Vorteile: Entfernt Navigation und Überflüssiges, fokussiert auf Artikelinhalt. Nachteile: Erfordert Node.js, unterstützt nicht alle Seitentypen.

Jina Reader

Eine gehostete API, die Markdown zurückgibt:

curl -s "https://r.jina.ai/https://example.com/article"

Vorteile: Keine Installation, funktioniert über HTTP. Nachteile: Rate-limitiert, erfordert Internet, Abhängigkeit von Drittanbieter, verarbeitet JavaScript-gerenderte Seiten schlecht.

Am besten für: Entwickler, die sich im Terminal wohlfühlen und Seiten massenweise konvertieren müssen.

Methode 3: Manuelles Kopieren

Der Low-Tech-Ansatz:

  1. Alle Inhalte auf der Seite auswählen (Cmd+A oder Ctrl+A)
  2. Kopieren (Cmd+C oder Ctrl+C)
  3. In einen Markdown-Editor einfügen
  4. Formatierung manuell korrigieren

Vorteile: Keine Tools nötig. Nachteile: Kopiert alles (Navigation, Anzeigen, Fußzeilen). Verliert Formatierung. Tabellen brechen. Codeblöcke verschwinden. Links werden zu Klartext. Zeitaufwändig für alles außer kurzen Artikeln.

Am besten für: Einmalige Speicherungen, wenn man nur ein paar Absätze braucht.

Vergleich

FunktionSave-ErweiterungCLI-ToolsKopieren
Einrichtungszeit10 Sekunden5-30 MinutenKeine
Ein-Klick-SpeicherungJaNeinNein
Saubere AusgabeKI-extrahiertVariiertManuelle Bereinigung
YouTube-TranskripteJaNeinNein
Twitter-ThreadsJaNeinTeilweise
Confluence/WikisJaTeilweiseUnordentlich
Codeblöcke erhaltenJaMeistensNein
Tabellen erhaltenJaMeistensNein
Offline nutzbarNeinJa (Pandoc)Ja
KostenKostenloser Plan verfügbarKostenlosKostenlos

Warum Webseiten als Markdown speichern?

Wenn du das hier liest, weißt du wahrscheinlich schon warum. Aber hier ist, warum Markdown bei der Speicherung von Web-Inhalten alle anderen Formate schlägt:

Es ist winzig. Ein typischer Artikel ist 5 KB in Markdown vs. 100 KB+ in HTML. Das ist 20x weniger Speicher und 20x weniger Tokens, wenn du es an eine KI gibst.

Es ist portabel. Öffne es in jedem Texteditor, jeder Notiz-App (Obsidian, Notion, Logseq), oder jedem Entwicklertool. Kein Vendor-Lock-in.

Es ist durchsuchbar. Mit grep über Hunderte von Markdown-Dateien in Millisekunden suchen. Versuch das mal mit PDFs.

LLMs lieben es. Claude, ChatGPT und andere KI-Tools wurden auf Millionen von Markdown-Dokumenten trainiert. Ihnen Markdown zu liefern produziert bessere Ergebnisse als rohes HTML oder PDF.

Es hält ewig. Klartextdateien sind das beständigste digitale Format. Deine .md-Dateien werden in 50 Jahren noch lesbar sein. Deine Lesezeichen überleben keine 5.

Loslegen

Der schnellste Weg, Webseiten als Markdown zu speichern: Save aus dem Chrome Web Store installieren. Es ist kostenlos zum Starten und dauert 10 Sekunden.


Verliere nie wieder eine Webseite. Save konvertiert jede Seite mit einem Klick in sauberes Markdown.