Elke Webpagina Opslaan als Markdown (3 Methoden)
Je wilt een webpagina opslaan als Markdown-bestand. Misschien bouw je een kennisbank, archiveer je documentatie, of wil je gewoon een schone kopie van een artikel. Hier zijn drie manieren om dat te doen, van eenvoudigst tot meest technisch.
Methode 1: Save Extensie (Eenvoudigst)
Save is een Chrome-extensie die elke webpagina met één klik naar schone Markdown converteert.
Hoe het werkt:
- Installeer Save uit de Chrome Web Store
- Bezoek een willekeurige webpagina
- Klik op het Save-pictogram
- Een
.md-bestand wordt gedownload naar je computer
Waarom het goed is:
- AI-aangedreven extractie verwijdert advertenties, navigatie en rommel
- Behoudt koppen, lijsten, codeblokken, tabellen en links
- Werkt op moeilijke pagina’s: YouTube (volledige transcripten), Twitter-threads, Reddit, Confluence, inhoud achter paywall
- Geen terminal, geen API-sleutels, geen configuratie
- Uitvoer is schone, gestructureerde Markdown klaar voor Obsidian, VS Code of AI-tools
Beste voor: Iedereen die schone Markdown wil zonder een terminal aan te raken.
Methode 2: Command-Line Tools
Verschillende CLI-tools converteren HTML naar Markdown:
Pandoc
Het Zwitserse zakmes voor documentconversie:
# Vanuit een URL (ophalen + converteren)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md
# Vanuit een lokaal HTML-bestand
pandoc input.html -o output.md
Voordelen: Krachtig, verwerkt complexe documenten, veel uitvoerformaten. Nadelen: Haalt ruwe HTML op (inclusief navigatie, advertenties, scripts). Uitvoer vereist vaak handmatige opruiming.
Defuddle
Een nieuwer hulpmiddel gericht op het extraheren van leesbare inhoud:
npm install -g defuddle
defuddle parse https://example.com/article --md
Voordelen: Verwijdert navigatie en rommel, richt zich op artikelinhoud. Nadelen: Vereist Node.js, verwerkt niet alle paginatypen.
Jina Reader
Gehoste API die Markdown teruggeeft:
curl -s "https://r.jina.ai/https://example.com/article"
Voordelen: Geen installatie, werkt via HTTP. Nadelen: Snelheidsbeperkt, vereist internet, afhankelijkheid van derden, verwerkt JavaScript-gerenderde pagina’s slecht.
Beste voor: Ontwikkelaars die vertrouwd zijn met de terminal en pagina’s in bulk willen converteren.
Methode 3: Handmatig Kopiëren en Plakken
De eenvoudige aanpak:
- Selecteer alle inhoud op de pagina (Cmd+A of Ctrl+A)
- Kopieer het (Cmd+C of Ctrl+C)
- Plak in een Markdown-editor
- Pas de opmaak handmatig aan
Voordelen: Geen tools nodig. Nadelen: Kopieert alles (navigatie, advertenties, voetteksten). Verliest opmaak. Tabellen breken. Codeblokken verdwijnen. Links worden platte tekst. Tijdrovend voor alles buiten een kort artikel.
Beste voor: Eenmalig opslaan als je maar een paar alinea’s nodig hebt.
Vergelijking
| Functie | Save Extensie | CLI-tools | Kopiëren |
|---|---|---|---|
| Installatietijd | 10 seconden | 5-30 minuten | Geen |
| Opslaan met één klik | Ja | Nee | Nee |
| Schone uitvoer | AI-geëxtraheerd | Wisselend | Handmatige opruiming |
| YouTube-transcripten | Ja | Nee | Nee |
| Twitter-threads | Ja | Nee | Deels |
| Confluence/wiki’s | Ja | Deels | Rommelig |
| Codeblokken bewaard | Ja | Meestal | Nee |
| Tabellen bewaard | Ja | Meestal | Nee |
| Werkt offline | Nee | Ja (Pandoc) | Ja |
| Kosten | Gratis tier beschikbaar | Gratis | Gratis |
Waarom Webpagina’s Opslaan als Markdown?
Als je dit leest, weet je waarschijnlijk al waarom. Maar hier is waarom Markdown elk ander formaat verslaat voor het opslaan van webinhoud:
Het is klein. Een typisch artikel is 5 KB in Markdown versus 100 KB+ in HTML. Dat is 20 keer minder opslag en 20 keer minder tokens als je het aan een AI geeft.
Het is draagbaar. Open het in elke teksteditor, elke notitie-app (Obsidian, Notion, Logseq), of elk ontwikkelaarstool. Geen vendor lock-in.
Het is doorzoekbaar. Grep door honderden Markdown-bestanden in milliseconden. Probeer dat met PDF’s.
LLM’s zijn er dol op. Claude, ChatGPT en andere AI-tools zijn getraind op miljoenen Markdown-documenten. Ze voorzien van Markdown levert betere resultaten dan ruwe HTML of PDF.
Het is eeuwigdurend. Platte tekstbestanden zijn het meest duurzame digitale formaat. Je .md-bestanden zijn over 50 jaar nog leesbaar. Je bladwijzers overleven 5 jaar niet.
Aan de Slag
De snelste manier om webpagina’s als Markdown op te slaan: Installeer Save uit de Chrome Web Store. Gratis om mee te beginnen en duurt 10 seconden om te installeren.
Verlies nooit meer een webpagina. Save converteert elke pagina naar schone Markdown met één klik.