Konverter Ethvert Nettsted til Ren Markdown for AI — Gratis Chrome-utvidelse
· Save Team
tutorialaimarkdownweb-clipperfirecrawlweb-scraping
Alle AI-arbeidsflyter starter med det samme problemet: å få ren tekst inn i modellen. Nettsider er fulle av navigasjon, annonser, skript og støy. Markdown fjerner alt det, og gir deg strukturert tekst som LLM-er faktisk kan jobbe med.
Hvorfor Markdown for AI?
- Tydelig hierarki — overskrifter, lister og seksjoner forteller modellen hvordan innholdet er organisert
- Ingen støy — ingen HTML-tagger, CSS, JavaScript eller sporingspikler
- Tokeneffektivitet — færre tokens betyr lavere kostnad
- Universelt format — hvert AI-verktøy godtar Markdown
En 5 000-ords nettside kan være 50 000 tokens som rå HTML. Det samme innholdet i Markdown? Ofte under 3 000 tokens.
Metode 1: Nettleserutvidelse (Enklest)
Save (Anbefalt)
Den raskeste måten å gå fra nettside til Markdown. Installer Chrome-utvidelsen, klikk på ikonet på en side, og last ned ren Markdown.
Hva som gjør den annerledes:
- AI identifiserer hovedinnhold og fjerner rot automatisk
- 300+ nettstedsspesifikke ledetråder for Amazon, YouTube, Reddit, GitHub
- YouTube-transkripsjoner oppsummeres til strukturerte notater
- Twitter/X-tråder trekkes ut som ren Markdown
Metode 2: Utvikler-API
from firecrawl import FirecrawlApp
app = FirecrawlApp(api_key="your-key")
result = app.scrape_url("https://example.com")
print(result["markdown"])
Eller Jina Reader (enklere): https://r.jina.ai/https://example.com
Metode 3: Kommandolinje
pandoc input.html -t markdown -o output.md
Sammenligning
| Brukstilfelle | Beste Metode |
|---|---|
| Lagre en artikkel for senere | Save-utvidelse |
| Mate en nettside til ChatGPT | Save-utvidelse |
| Bygge en RAG-kunnskapsbase | Firecrawl API |
| Batchkonvertere lokale HTML-filer | Pandoc CLI |
Har du spørsmål? Kontakt oss på [email protected]