Como salvar um post do Substack em Markdown (com paywall, sem cross-promo)
O Substack não quer que você saia com o conteúdo. Não há exportação nativa, nenhum botão “baixar este post”, nenhuma API pública para que assinantes pagos façam backup dos ensaios pelos quais pagaram. Cada post que você abre está envolto em overlays de modal de assinatura, blocos de cross-promotion de outras newsletters da rede, e um rodapé que implora por um endereço de e-mail. Se você já tentou jogar um ensaio do Substack no Claude ou Obsidian, conhece o problema --- copiar da página arrasta o barulho junto.
Este guia cobre todos os métodos para converter um post do Substack em Markdown limpo --- de um único ensaio a um long-read com paywall e áudio embutido.
Por que salvar posts do Substack em Markdown?
Markdown é o formato que funciona em qualquer lugar onde uma newsletter precise ir:
- Arquive seus ensaios favoritos --- autores deixam o Substack, posts ficam atrás de paywalls, contas são suspensas. Suas anotações não deveriam depender do uptime de uma plataforma
- Construa uma biblioteca de pesquisa --- uma pasta de arquivos
.mdlimpos é pesquisável em segundos por centenas de newsletters - Alimente um LLM --- Claude, ChatGPT, Gemini e modelos locais leem Markdown nativamente como contexto
- Escape do lock-in da plataforma --- uma assinatura paga compra acesso, não propriedade. Markdown te dá a cópia pela qual você já pagou
- Cite uma passagem específica --- encontrar “aquele parágrafo sobre juros compostos” em um ensaio de 5.000 palavras está a uma busca de distância
- Traduza um post em idioma estrangeiro --- uma vez que é texto, qualquer ferramenta de tradução funciona nele
O caso de uso que impulsiona a maior parte do tráfego de Substack-para-Markdown em 2026 são os dois primeiros: pessoas querem uma cópia permanente e portátil dos ensaios que importam para elas, desacoplada da plataforma.
Método 1: Save (mais rápido, um clique)
O Save é uma extensão do Chrome que transforma qualquer post do Substack em um arquivo Markdown com um clique. Lê o corpo do post diretamente do DOM, retira cada modal de assinatura e bloco de cross-promo, e produz algo que se lê como o ensaio original, não como uma página raspada.
Como funciona:
- Abra o post do Substack no Chrome
- Clique no ícone da extensão Save na sua barra de ferramentas
- Um arquivo
.mdé baixado instantaneamente (ou cai no seu Save Vault se conectado)
O que você recebe:
- Título e subtítulo do post como cabeçalhos Markdown
- Nome do autor, data de publicação e nome da newsletter no frontmatter
- Corpo completo com todos os cabeçalhos, citações e imagens inline preservados
- Blocos de citação mantidos como citações Markdown
>, não renderizados como estilos de página - Episódios de podcast embutidos como referências de áudio Markdown com a URL original
- Notas de rodapé inline onde pertencem
- Frontmatter com título, autor, newsletter, data de publicação e URL canônica
O que é removido:
- Overlays de modal de assinatura que aparecem no meio do scroll
- Blocos de cross-promotion “From X’s Substack” no topo e fim do post
- Banners de call-to-action “Share this post” / “Pledge your support” / “Restack”
- Formulários de cadastro no rodapé e grades de recomendação
- Chrome de navegação do Substack e barra flutuante de progresso de leitura
Ideal para: pesquisadores, escritores, qualquer um com assinaturas pagas que queira realmente possuir, usuários de IA alimentando contexto para Claude ou ChatGPT. Se você precisa de um ensaio limpo que vai colar em um LLM ou ler no Obsidian, este é o caminho mais limpo.
Exemplo de saída
Salvar um ensaio do Packy McCormick produz:
---
title: "The Substack Renaissance"
subtitle: "How creator-led media is rebuilding the internet from the bottom up"
author: Packy McCormick
newsletter: Not Boring
url: https://www.notboring.co/p/the-substack-renaissance
date: 2026-02-14
---
# The Substack Renaissance
## How creator-led media is rebuilding the internet from the bottom up
Five years ago, the idea that a single writer could sustain a six-figure
business from a newsletter sounded absurd. Today there are hundreds of
them, and the model is starting to eat traditional media from the edges.
> "The best journalism of the next decade won't come from newsrooms.
> It'll come from one person, a Substack, and a community of 20,000
> readers who actually care."
## Why Now
Three things converged...
Esse arquivo está a uma colagem de ser contexto Claude utilizável, a uma tecla de ser uma nota Obsidian permanente.
Método 2: e-mail + reformatação manual
Cada post do Substack também é entregue como e-mail. Você pode salvar o e-mail e convertê-lo em Markdown manualmente.
Passos:
- Abra o post no seu Gmail ou Apple Mail
- Ver fonte ou “Mostrar original”, copie o HTML
- Passe por um conversor HTML-para-Markdown (Pandoc, turndown, html2md)
- Retire manualmente o banner do cabeçalho, o formulário de cadastro do rodapé e os blocos de cross-promo
Problemas com essa abordagem:
- E-mails do Substack são envoltos em HTML pesado baseado em tabelas que converte em Markdown feio
- Os blocos de cross-promo (“Subscribe to X who also writes on Substack”) são profundamente aninhados e difíceis de retirar com uma única regex
- Podcasts embutidos vêm como players de áudio inline que não se traduzem em Markdown
- Notas de rodapé são duplicadas entre o corpo e o rodapé do e-mail
- Imagens são referenciadas por URLs de tracking que expiram
- Posts com paywall chegam como prévias truncadas no e-mail, então o ensaio completo nem está lá
Viável para um único post curto. Desmorona em qualquer coisa longa ou em conteúdo pago.
Método 3: feed RSS + script
Todo Substack público tem um feed RSS em <newsletter>.substack.com/feed. Você pode consultá-lo e converter cada item em Markdown.
curl https://newsletter.substack.com/feed | \
pandoc -f html -t markdown -o post.md
Ideal para: times de engenharia arquivando newsletters em escala, ou qualquer um construindo um pipeline de leitura automatizado. Requer um ambiente de scripting e um cron job.
Problemas com essa abordagem:
- RSS só expõe posts gratuitos. Ensaios com paywall não aparecem no feed
- O feed retorna o HTML formatado para e-mail, então você herda todo o barulho de cross-promo e formulário de cadastro
- Sem metadados de autor além do nome do canal --- posts convidados são atribuídos à newsletter, não ao escritor
- Podcasts embutidos são retirados do payload RSS
- Citações perdem o estilo e se fundem com o texto do corpo
- A passagem de limpeza (remover blocos de assinatura, corrigir URLs de imagens) é um passo separado
Este é o método certo se você está construindo um pipeline para uma newsletter pública sobre a qual tem direitos. É exagero para um único post, e não consegue alcançar o conteúdo pago que a maioria dos leitores realmente quer arquivar.
Método 4: Salvar como PDF do navegador + OCR
O “Salvar como PDF” do Chrome funciona em qualquer página, incluindo posts com paywall do Substack nos quais você está logado.
Passos:
- Abra o post no Chrome
Cmd+P, escolha “Salvar como PDF”- Passe o PDF por uma ferramenta de OCR (Adobe Acrobat, Tesseract, ou
pdftotext) - Limpe a saída em Markdown
Problemas para o caso de uso Markdown:
- A saída é formatada por página, não por documento --- cabeçalhos perdem hierarquia, parágrafos quebram nos limites de página
- Overlays de modal de assinatura frequentemente renderizam dentro do PDF, então o barulho vem com você
- Citações, blocos de citação e amostras de código todos perdem estrutura
- Imagens são queimadas na página como pixels, não referenciadas --- nenhuma forma de recuperar os originais
- OCR introduz erros de digitação em tipografias serif pesadas de newsletters
- Podcasts embutidos e links não sobrevivem ao round-trip do PDF
Método de último recurso quando nada mais consegue alcançar o conteúdo. Não é um workflow primário.
Qual método você deve usar?
| Cenário | Melhor método |
|---|---|
| Colar um ensaio do Substack no Claude ou ChatGPT | Save --- um clique, saída estruturada |
| Arquivar suas assinaturas pagas | Save --- funciona em posts com paywall em que você está logado |
| Construir uma biblioteca pessoal de pesquisa de newsletters | Save --- frontmatter consistente, fácil de pesquisar |
| Auto-arquivar uma newsletter gratuita em escala | RSS + script --- programático, mas só posts gratuitos |
| Fluxo só por e-mail com triagem manual | E-mail + reformatação --- funciona se você só salva 1-2 ensaios por semana |
| Captura de último recurso de uma página ilegível | Salvar como PDF + OCR --- barulhento mas sempre funciona |
Para a maioria das pessoas --- especialmente qualquer um com assinaturas pagas ou usando Substack como input de pesquisa --- Save é a resposta. Produz o Markdown mais limpo sem configuração, e lida com ensaios com paywall da mesma forma que lida com posts gratuitos: a partir do que o navegador logado pode ver.
Casos extremos que o Save lida
- Posts com paywall. Save vê o que seu navegador logado vê. Se você é assinante pago, recebe o ensaio completo. Se não, recebe a prévia pública, exatamente como aparece na página. Sem cracking, sem scraping --- apenas uma cópia limpa do que você já tem acesso.
- Blocos de cross-promoção. O Substack injeta blocos de recomendação “From X’s Substack” no topo e fim da maioria dos posts. Save os retira automaticamente. O Markdown exportado contém apenas o ensaio em si, atribuído ao autor real.
- Episódios de podcast embutidos. Posts do Substack incluem cada vez mais áudio. Save captura o episódio como uma referência de áudio Markdown com a URL original, então você pode reescutar ou enviar para uma ferramenta de transcrição depois.
- Seções de comentários. Comentários de nível superior são capturados com nome do comentador e data. Threads profundamente aninhados são resumidos em vez de despejados brutos, então uma discussão de 400 comentários não infla o arquivo.
- Threads (a função tipo Twitter do Substack). Salvos como lista Markdown cronológica com autor e timestamp, a mesma forma de um export de thread do Twitter.
- Notes. Os micro-posts do Substack também funcionam. O Markdown é mais curto mas tem a mesma forma de frontmatter, então ficam ao lado de posts longos na mesma pasta.
- Várias newsletters do mesmo autor. Cada post recebe seu nome de newsletter no frontmatter, então um escritor que publica em três Substacks diferentes acaba em três baldes pesquisáveis sem tagging manual.
- Domínios personalizados. Muitos Substacks rodam em seu próprio domínio (
stratechery.com,notboring.co,noahpinion.blog). Save detecta o backend movido a Substack independente da URL e aplica o mesmo export limpo. - Posts com muitas imagens. Imagens permanecem referenciadas por suas URLs originais, com texto alt e legendas preservados. O arquivo permanece pequeno e portátil.
Combine com seu workflow
A saída Markdown funciona onde quer que você precise:
- Claude / ChatGPT / Gemini --- cole o arquivo, faça perguntas de follow-up sobre o ensaio
- Obsidian --- jogue no seu vault, conecte a notas relacionadas, pesquise por todas suas newsletters salvas
- Notion --- cole diretamente, cabeçalhos e citações renderizam corretamente
- Apple Notes --- importação limpa via extensão de compartilhamento Markdown
- Readwise / Reader --- o Markdown importa limpo sem o barulho de cross-promo e cadastro que vem de um save de URL bruto
- Save Vault --- se você tem um conectado, todo save do Substack cai lá automaticamente com backlinks e tags
FAQ
O Save funciona em posts do Substack com paywall? Sim, nos posts aos quais sua conta tem acesso. Save lê o que seu navegador logado pode ver. Se você é assinante pago, recebe o ensaio completo. Se não, recebe a prévia pública, exatamente como o Substack te mostra.
O Save funciona em Substacks de domínio personalizado?
Sim. Substacks que rodam no próprio domínio (Stratechery, Not Boring, Noahpinion) exportam da mesma forma que sites *.substack.com. A extensão detecta o backend movido a Substack.
Posso salvar Substack Notes e Threads? Sim. Notes exportam como arquivos Markdown curtos. Threads exportam como listas Markdown cronológicas com autor e timestamp em cada entrada.
E a seção de comentários? Comentários de nível superior são capturados com nome do comentador e data. Threads profundamente aninhados são resumidos para manter o arquivo legível. Se você quiser cada comentário literal, é uma opção de uma linha nas configurações da extensão.
O Save retira os modais “Subscribe now” e blocos de cross-promo? Sim. Overlays de modal de assinatura, blocos de cross-promotion “From X’s Substack”, banners “Pledge your support” e formulários de cadastro do rodapé são todos removidos. O Markdown exportado contém apenas o post em si.
Preserva imagens e citações?
Sim. Imagens são referenciadas por suas URLs originais com texto alt e legendas intactos. Citações exportam como blocos de citação Markdown (>).
E os episódios de podcast embutidos? Capturados como referência de áudio Markdown com a URL original do episódio. Se quiser uma transcrição, envie a URL para sua ferramenta de transcrição preferida depois.
Salvar um post do Substack compartilha minha conta com alguém? Não. A extensão roda localmente no seu navegador. Lê o post da mesma forma que seu navegador faz e escreve o Markdown na sua máquina. Nenhum dado de login sai do seu computador.
Quanto custa? Save tem um nível gratuito para você experimentar em alguns posts. Depois disso, uma pequena assinatura cobre o uso contínuo.
Guias Save relacionados
- Salvar artigos do Medium em Markdown --- o post com paywall que você abriu em modo anônimo, capturado de forma limpa
- Salvar vídeos do YouTube em Markdown --- transcrição, resumo, timestamps, tudo em um arquivo
- Salvar threads do Twitter / X em Markdown --- cada tweet, em ordem, com atribuição
- Salvar páginas do Notion em Markdown --- toggles expandidos, bases de dados como tabelas
## Continue reading
Como salvar uma conversa do Claude como Markdown (Artifacts, citações, Projects)
Converta conversas do Claude em Markdown limpo: cada turno, Artifacts como blocos de código, citações preservadas. Guia completo para pesquisadores e usuários de IA.
Como salvar uma conversa do ChatGPT como Markdown (cada turno, blocos de código intactos)
Converta qualquer conversa do ChatGPT em Markdown limpo: cada turno, blocos de código, tabelas, citações. Guia completo 2026 para pesquisadores e usuários de IA.
Como Salvar uma Thread do Reddit em Markdown (Com Comentários e Contexto)
Converta qualquer thread do Reddit em Markdown limpo com comentários aninhados, karma, flair e marcadores OP preservados. Guia completo 2026 para pesquisadores e usuários de IA.
Como salvar uma thread do Twitter / X em Markdown (thread completa, em ordem)
Converta qualquer thread do Twitter ou X em Markdown limpo: cada tweet em ordem de publicação, com atribuição, timestamps e quote-tweets aninhados. Guia 2026.
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.