Como Salvar uma Thread do Reddit em Markdown (Com Comentários e Contexto)

·

O Reddit é onde vivem as respostas de verdade --- a thread de troubleshooting que realmente resolveu seu problema, o AMA enterrado quatro anos atrás, o subreddit de nicho onde os especialistas se reúnem. Mas o Reddit não te dá nada para levar. Sem exportação, sem botão “salvar como”, sem jeito de tirar uma thread mantendo o contexto dos comentários intacto. Copiar-colar achata o aninhamento e remove o karma. Se você já tentou jogar uma thread do Reddit para o Claude ou ChatGPT, conhece o problema --- colar a URL não dá nada ao modelo, e colar o texto visível perde a estrutura que tornava a thread valiosa para leitura.

Este guia cobre todos os métodos para converter uma thread do Reddit em Markdown limpo --- de uma pergunta rápida a um AMA de 2.000 comentários.

Por que salvar threads do Reddit em Markdown?

O conteúdo do Reddit é singularmente frágil, e singularmente valioso como material de pesquisa:

  • Alimentar um LLM --- Claude, ChatGPT, Gemini e modelos locais leem Markdown nativamente como contexto
  • Arquivar antes que desapareça --- usuários deletam contas, mods removem posts, subreddits viram privados da noite para o dia
  • Citar uma cadeia específica de comentários --- a resposta raramente é o comentário top, geralmente está três respostas abaixo
  • Jogar no Obsidian ou Notion --- um arquivo só, totalmente pesquisável, com a estrutura da discussão intacta
  • Construir uma base de conhecimento pessoal --- recomendações de produto, troubleshooting, AMAs, expertise de nicho

O caso de uso que puxa a maior parte do tráfego Reddit-para-Markdown em 2026 é o primeiro: as pessoas querem pedir a um LLM para resumir uma thread de 500 comentários, encontrar a resposta consensual, ou extrair a recomendação mais votada. Colar a URL não funciona, e colar HTML cru inunda a janela de contexto.

Método 1: Save (mais rápido, um clique)

O Save é uma extensão do Chrome que transforma qualquer thread do Reddit em um arquivo Markdown com um clique. Ele percorre a árvore de comentários, preserva o aninhamento, e produz um arquivo que se lê como uma discussão estruturada em vez de uma parede de texto.

Como funciona:

  1. Abra a thread do Reddit no Chrome (funciona tanto em old.reddit.com quanto em www.reddit.com)
  2. Clique no ícone da extensão Save na barra de ferramentas
  3. Um arquivo .md baixa instantaneamente (ou pousa no seu Save Vault se estiver conectado)

O que você recebe:

  • Corpo do post original, título, subreddit, autor e pontuação no topo
  • As ramificações de comentários com maior pontuação, com aninhamento completo de respostas preservado
  • Pontuação de karma, flair e marcadores OP em cada comentário
  • Frontmatter com URL, subreddit, data do post e contagem total de comentários
  • A thread inteira em um arquivo --- post e comentários juntos, não duas exportações

O que é removido:

  • Widgets da barra lateral, regras do subreddit, posts recomendados
  • Posts patrocinados e slots de anúncio entre comentários
  • Chrome de navegação do Reddit, rodapé e prompts “What are your thoughts?”
  • Comentários fixados do AutoModerator (a menos que ativados explicitamente)
  • Corpos de comentários deletados/removidos (substituídos por um placeholder para a estrutura da thread continuar legível)

Melhor para: pesquisadores, usuários de IA, qualquer um que trate o Reddit como uma fonte séria de conhecimento. Se você precisa de uma thread limpa para colar no Claude ou ler no Obsidian, este é o caminho mais limpo. O killer feature é o aninhamento dos comentários --- copiar-colar destrói, todo outro método perde, o Save mantém.

Exemplo de saída

Salvar uma thread popular de r/selfhosted produz:

---
title: "What's your favorite self-hosted app that nobody talks about?"
subreddit: r/selfhosted
author: u/homelabdad
url: https://www.reddit.com/r/selfhosted/comments/abc123/...
score: 1247
comments: 384
date: 2026-03-12
---

## Post

I've been running a homelab for 5 years and the apps that get all the
attention (Plex, Home Assistant, Nextcloud) are great, but the ones I
actually rely on every day are tiny tools nobody mentions. What's yours?

## Top Comments

### u/devops_anna --- 892 points
[Mealie](https://mealie.io) is criminally underrated. Recipe manager
that scrapes from any URL, meal planning, shopping lists. Replaced
three apps for me.

  - **u/homelabdad** (OP) --- 124 points
    > Just installed it after seeing this. The URL scraper is magic.

  - **u/recipe_hoarder** --- 67 points
    > Been using it 2 years. The Nextcloud integration is solid too.

### u/raspberry_pi_4 --- 654 points
**Beszel** for monitoring. Lighter than Grafana, prettier than Uptime
Kuma, zero config. Single binary on every host.

  - **u/devops_anna** --- 203 points
    > Switched from Netdata last month. No regrets.

Esse arquivo está a uma colagem de ser contexto utilizável para o Claude, a um toque de tecla de ser uma nota permanente no Obsidian. O aninhamento renderiza corretamente em qualquer leitor de Markdown, e as pontuações de karma deixam óbvio quais ramificações importam.

Método 2: a exportação nativa do Reddit (limitada)

O Reddit deixa você pedir uma exportação de dados da sua própria atividade via Settings → Privacy & Security → Request Data.

Passos:

  1. Vá em reddit.com/settings/data-request
  2. Envie uma solicitação GDPR ou CCPA
  3. Espere até 30 dias por um email com link de download
  4. Receba um ZIP de arquivos CSV

Problemas dessa abordagem:

  • Cobre apenas sua própria atividade (posts que você fez, comentários que você escreveu, items salvos)
  • Você não pode exportar a thread de outra pessoa ou um AMA
  • A saída é CSV, não Markdown --- sem estrutura, sem aninhamento, só linhas
  • Corpos de comentários são despejados em plano sem relações pai-filho
  • A espera de 30 dias torna inútil para pesquisa ativa
  • Sem suporte para exportar uma única thread em contexto

Útil exatamente uma vez, quando você quer fazer backup do seu histórico do Reddit. Inútil para tudo o mais.

Método 3: PRAW ou a API do Reddit

Para times de engenharia, a API oficial do Reddit (e seu excelente wrapper Python PRAW) deixa você puxar qualquer thread programaticamente.

import praw

reddit = praw.Reddit(client_id="...", client_secret="...", user_agent="...")
submission = reddit.submission(url="https://reddit.com/r/.../comments/...")
submission.comments.replace_more(limit=None)

for comment in submission.comments.list():
    print(comment.author, comment.score, comment.body)

Melhor para: times de engenharia construindo pipelines de ingestão do Reddit, datasets de treinamento, ou scrapers de pesquisa em larga escala.

Problemas dessa abordagem:

  • A API do Reddit agora exige registro e aplica limites de taxa rigorosos (desde as mudanças de 2023)
  • O tier gratuito limita a 100 queries por minuto por cliente OAuth, duro para threads profundas com replace_more
  • Sem formatação Markdown --- você recebe texto cru, sem estrutura de aninhamento, sem renderização do próprio Markdown do Reddit
  • Construir uma árvore a partir da lista plana de comentários é um passo separado
  • Uso comercial / de alto volume requer um acordo pago com o Reddit

Esse é o método certo se você está construindo um produto. Selvagemente exagerado para uma única thread.

Método 4: cópia do navegador + Pandoc

O fallback manual: copiar a thread renderizada do navegador e reformatar.

# After copying the thread to a file as HTML:
pandoc thread.html -f html -t markdown -o thread.md

Melhor para: um resgate pontual de uma thread que você absolutamente precisa agora, sem ferramentas instaladas.

Problemas dessa abordagem:

  • Copiar-colar do Reddit achata o aninhamento --- o Pandoc não pode recuperar o que o Chrome não incluiu
  • Pontuações de karma, flair, marcadores OP e timestamps pousam inline como ruído visual
  • Expansões “Load more comments” precisam ser feitas manualmente antes da cópia
  • Posts de imagem, enquetes e posts de vídeo perdem o conteúdo inteiramente
  • A saída precisa de edição manual pesada para ser usável

Funciona num aperto em uma thread curta. Cai em qualquer coisa com profundidade.

Qual método você deve usar?

CenárioMelhor Método
Colar uma thread no Claude ou ChatGPTSave --- um clique, aninhamento preservado
Arquivar um AMA longo antes que seja travadoSave --- captura a árvore inteira em um arquivo
Citar uma cadeia específica de comentários em notas de pesquisaSave --- karma + flair + marcadores OP intactos
Construir um pipeline interno de ingestão do RedditPRAW --- programaticamente, com chave de API em mão
Fazer backup do seu histórico do RedditExportação de dados do Reddit --- único método que te dá seus próprios dados
Resgatar uma única thread sem ferramentasCópia + Pandoc --- manual mas funciona offline

Para a maioria das pessoas --- especialmente quem usa o Reddit como contexto de IA ou material de pesquisa --- o Save é a resposta. Ele produz o Markdown mais limpo sem configuração nenhuma, e lida com AMAs de 2.000 comentários na mesma velocidade de um post de cinco comentários.

Casos limite que o Save lida

  • Comentários específicos com permalink. Se você abre uma URL como /comments/abc/_/xyz/, o Reddit mostra apenas aquele comentário e suas respostas. O Save respeita isso --- ele captura a subárvore de comentários a partir daquela âncora para baixo, não a thread inteira. Útil quando a resposta que você quer está seis níveis abaixo.
  • Threads de comentários muito profundas. O Reddit colapsa threads além de uma certa profundidade com “continue this thread”. O Save segue esses links e costura de volta as ramificações profundas, com uma indentação que permanece legível em Markdown. Em casos extremos (10+ níveis), ele muda para um formato plano-com-breadcrumb para o arquivo não virar uma barra de rolagem horizontal.
  • Comentários deletados e removidos. Quando um comentário mostra [deleted] ou [removed], o Save mantém o placeholder para a estrutura da árvore continuar intacta. A cadeia de respostas embaixo é preservada --- você ainda pode ler as respostas mesmo quando o comentário original sumiu.
  • old.reddit.com vs new.reddit.com. Ambos layouts funcionam. O Save detecta automaticamente em qual você está e parseia adequadamente. old.reddit tende a dar uma saída ligeiramente mais limpa porque o DOM é mais simples, mas new.reddit funciona bem.
  • Subreddits privados e restritos. O Save vê o que seu navegador logado vê. Se você é aprovado em um sub privado, o Save pode capturar threads lá. Se você não consegue ver, o Save também não.
  • Threads arquivadas. O Reddit arquiva threads após 6 meses e trava novos comentários. O Save as captura identicamente --- o status de arquivada não muda o parsing.
  • Enquetes e posts de imagem. Resultados de enquetes (contagens de voto atuais, opções) são capturados como uma lista. Posts de imagem incluem a URL da imagem e texto alt no frontmatter. Posts de vídeo incluem a URL do vídeo e a auto-transcrição se o Reddit gerou uma.
  • Crossposts. Quando uma thread é um crosspost, o Save linka ao original e captura a discussão acontecendo no crosspost atual, não na fonte.

Combine com seu workflow

A saída Markdown funciona onde quer que você precise:

  • Claude / ChatGPT / Gemini --- cole o arquivo, faça perguntas de follow-up como “qual é a escolha consensual de produto?” ou “resuma os três principais caminhos de troubleshooting”
  • Obsidian --- jogue no seu vault, linke a notas relacionadas, busque entre todas as threads que você salvou sobre um tópico
  • Notion --- cole diretamente, a estrutura aninhada dos comentários renderiza como toggles
  • Apple Notes --- importação limpa via extensão de compartilhamento Markdown
  • Save Vault --- se você conectou um, todo save do Reddit pousa lá automaticamente com backlinks e tags de subreddit

FAQ

O Save funciona no site mobile ou app do Reddit? A extensão é desktop Chrome apenas por enquanto. No mobile, copie a URL e abra no desktop, ou compartilhe para um Save Vault no Mac (que tem um URL handler).

E o novo redesign do Reddit com comentários de scroll infinito? O Save lida tanto com o layout clássico quanto com o redesenhado. No novo Reddit, ele dispara automaticamente as expansões “load more comments” antes do parsing, então você não precisa rolar a thread inteira primeiro.

Posso salvar só o post original, sem os comentários? Sim. A extensão te deixa escolher: só post, post + top comentários, ou thread completa. O padrão é post + top comentários, porque geralmente é o que você realmente quer.

Ele preserva a formatação Markdown do Reddit nos comentários? Sim. Negrito, itálico, links, blocos de código, blockquotes e listas nos comentários são mantidos como Markdown na saída --- eles já eram Markdown do lado do Reddit.

Como ele lida com threads de milhares de comentários? O Save captura as ramificações com maior pontuação primeiro e desce por pontuação. Em um AMA de 2.000 comentários, a saída padrão mantém as 200 primeiras cadeias de comentários ou perto disso --- aquelas com karma acima do limiar. Você pode configurar a profundidade e o limiar nas configurações da extensão se quiser tudo ou só o topo.

E threads NSFW? O Save captura identicamente a qualquer outra thread --- ele não filtra por tag NSFW. Se você pode ver a thread, o Save pode salvar.

A pontuação de karma é precisa no momento do salvamento? Sim, as pontuações são capturadas no momento que você clica em Save. O Reddit arredonda de forma fuzzy pontuações grandes (“12.4k”) na página; o Save usa o inteiro exato quando a API expõe, caso contrário mantém o valor arredondado mostrado.

Quanto custa? O Save tem um tier gratuito para você poder testar em algumas threads. Depois, uma assinatura pequena cobre os custos de parsing e armazenamento.

Guias Save relacionados

## Continue reading

Jean-Sébastien Wallez

Written by

Jean-Sébastien Wallez

I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.

## try save

Pronto para salvar de forma mais inteligente?

Converta qualquer página da web em Markdown com um clique.

Adicionar ao Chrome 🐿️