Como Salvar Qualquer Página da Web como Markdown (3 Métodos)
Você quer salvar uma página da web como um arquivo Markdown. Talvez você esteja construindo uma base de conhecimento, arquivando documentação ou apenas queira uma cópia limpa de um artigo. Aqui estão três maneiras de fazer isso, da mais simples à mais técnica.
Método 1: Extensão Save (Mais Fácil)
Save é uma extensão do Chrome que converte qualquer página da web para Markdown limpo com um clique.
Como funciona:
- Instale Save da Chrome Web Store
- Visite qualquer página da web
- Clique no ícone Save
- Um arquivo
.mdé baixado para o seu computador
O que o torna bom:
- A extração alimentada por IA remove anúncios, navegação e desordem
- Preserva títulos, listas, blocos de código, tabelas e links
- Funciona em páginas difíceis: YouTube (transcrições completas), threads do Twitter, Reddit, Confluence, conteúdo pago (paywalled)
- Sem terminal, sem chaves de API, sem configuração
- A saída é Markdown limpo e estruturado, pronto para Obsidian, VS Code ou ferramentas de IA
Melhor para: Qualquer pessoa que queira Markdown limpo sem tocar em um terminal.
Método 2: Ferramentas de Linha de Comando
Várias ferramentas CLI convertem HTML para Markdown:
Pandoc
O canivete suíço da conversão de documentos:
# De uma URL (buscar + converter)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md
# De um arquivo HTML local
pandoc input.html -o output.md
Prós: Poderoso, lida com documentos complexos, muitos formatos de saída. Contras: Busca HTML bruto (inclui navegação, anúncios, scripts). A saída geralmente precisa de limpeza manual.
Defuddle
Uma ferramenta mais recente focada na extração de conteúdo legível:
npm install -g defuddle
defuddle parse https://example.com/article --md
Prós: Remove navegação e desordem, foca no conteúdo do artigo. Contras: Requer Node.js, não lida com todos os tipos de página.
Jina Reader
API hospedada que retorna Markdown:
curl -s "https://r.jina.ai/https://example.com/article"
Prós: Sem instalação, funciona via HTTP. Contras: Com limite de taxa (rate-limited), requer internet, dependência de terceiros, não lida bem com páginas renderizadas por JavaScript.
Melhor para: Desenvolvedores que se sentem confortáveis no terminal e precisam converter páginas em lote.
Método 3: Copiar e Colar Manualmente
A abordagem de baixa tecnologia:
- Selecione todo o conteúdo da página (Cmd+A ou Ctrl+A)
- Copie (Cmd+C ou Ctrl+C)
- Cole em um editor Markdown
- Corrija a formatação manualmente
Prós: Nenhuma ferramenta necessária. Contras: Copia tudo (navegação, anúncios, rodapés). Perde a formatação. Tabelas quebram. Blocos de código desaparecem. Links se tornam texto simples. Demorado para qualquer coisa além de um artigo curto.
Melhor para: Salvar uma única vez quando você precisa apenas de alguns parágrafos.
Comparação
| Característica | Extensão Save | Ferramentas CLI | Copiar e Colar |
|---|---|---|---|
| Tempo de configuração | 10 segundos | 5-30 minutos | Nenhum |
| Salvar com um clique | Sim | Não | Não |
| Saída limpa | Extraído por IA | Varia | Limpeza manual |
| Transcrições do YouTube | Sim | Não | Não |
| Threads do Twitter | Sim | Não | Parcial |
| Confluence/wikis | Sim | Parcial | Bagunçado |
| Blocos de código preservados | Sim | Geralmente | Não |
| Tabelas preservadas | Sim | Geralmente | Não |
| Funciona offline | Não | Sim (Pandoc) | Sim |
| Custo | Camada gratuita disponível | Gratuito | Gratuito |
Por Que Salvar Páginas da Web como Markdown?
Se você está lendo isso, provavelmente já sabe. Mas aqui está o porquê o Markdown supera todos os outros formatos para salvar conteúdo da web:
É minúsculo. Um artigo típico tem 5KB em Markdown vs 100KB+ em HTML. Isso é 20x menos armazenamento e 20x menos tokens se você o alimentar para uma IA.
É portátil. Abra-o em qualquer editor de texto, qualquer aplicativo de anotações (Obsidian, Notion, Logseq) ou qualquer ferramenta de desenvolvedor. Sem bloqueio de fornecedor (vendor lock-in).
É pesquisável. Faça ‘grep’ em centenas de arquivos Markdown em milissegundos. Tente isso com PDFs.
LLMs adoram. Claude, ChatGPT e outras ferramentas de IA foram treinadas em milhões de documentos Markdown. Alimentá-los com Markdown produz melhores resultados do que HTML bruto ou PDF.
Dura para sempre. Arquivos de texto simples são o formato digital mais durável. Seus arquivos .md serão legíveis em 50 anos. Seus favoritos não sobreviverão 5.
Comece Agora
A maneira mais rápida de começar a salvar páginas da web como Markdown: Instale Save da Chrome Web Store. É gratuito para começar e leva 10 segundos para instalar.
Nunca mais perca uma página da web. Save converte qualquer página para Markdown limpo com um clique.