Cómo guardar un hilo de Reddit en Markdown (con comentarios y contexto)
Reddit es donde viven las respuestas de verdad --- el hilo de troubleshooting que sí resolvió tu problema, el AMA enterrado hace cuatro años, el subreddit de nicho donde se reúnen los expertos. Pero Reddit no te da nada que llevarte. No hay exportación, no hay botón de «guardar como», no hay forma de extraer un hilo manteniendo el contexto de sus comentarios. El copia-y-pega aplana la anidación y borra el karma. Si alguna vez has intentado pasarle un hilo de Reddit a Claude o ChatGPT, conoces el problema --- pegar la URL no le da nada al modelo, y pegar el texto visible pierde la estructura que hacía valioso el hilo.
Esta guía cubre todos los métodos para convertir un hilo de Reddit en Markdown limpio --- desde una pregunta rápida hasta un AMA de 2.000 comentarios.
¿Por qué guardar hilos de Reddit en Markdown?
El contenido de Reddit es excepcionalmente frágil, y excepcionalmente valioso como material de investigación:
- Pasárselo a un LLM --- Claude, ChatGPT, Gemini y los modelos locales leen Markdown de forma nativa como contexto
- Archivar antes de que desaparezca --- los usuarios borran cuentas, los moderadores eliminan posts, los subreddits se vuelven privados de un día para otro
- Citar una cadena específica de comentarios --- la respuesta rara vez es el comentario top, suele estar tres respuestas más abajo
- Meterlo en Obsidian o Notion --- un único archivo, totalmente buscable, con la estructura de la discusión intacta
- Construir una base de conocimiento personal --- recomendaciones de productos, troubleshooting, AMAs, experticia de nicho
El caso de uso que impulsa la mayoría del tráfico Reddit-a-Markdown en 2026 es el primero: la gente quiere pedirle a un LLM que resuma un hilo de 500 comentarios, encuentre la respuesta consensuada o extraiga la recomendación más votada. Pegar la URL no funciona, y pegar HTML en bruto inunda la ventana de contexto.
Método 1: Save (el más rápido, un clic)
Save es una extensión de Chrome que convierte cualquier hilo de Reddit en un archivo Markdown con un solo clic. Recorre el árbol de comentarios, preserva la anidación y produce un archivo que se lee como una discusión estructurada en lugar de un muro de texto.
Cómo funciona:
- Abre el hilo de Reddit en Chrome (funciona tanto en
old.reddit.comcomo enwww.reddit.com) - Haz clic en el icono de la extensión Save en tu barra de herramientas
- Un archivo
.mdse descarga al instante (o aterriza en tu Save Vault si la tienes conectada)
Lo que obtienes:
- Cuerpo del post original, título, subreddit, autor y puntuación arriba
- Las ramas de comentarios con más puntuación, con la anidación completa de respuestas preservada
- Puntuación de karma, flair y marcadores OP en cada comentario
- Frontmatter con URL, subreddit, fecha del post y número total de comentarios
- Todo el hilo en un único archivo --- post y comentarios juntos, no dos exportaciones
Lo que se elimina:
- Widgets de la barra lateral, reglas del subreddit, posts recomendados
- Posts promocionados y huecos publicitarios entre comentarios
- El chrome de navegación de Reddit, el pie y los prompts «What are your thoughts?»
- Comentarios anclados de AutoModerator (salvo que se active explícitamente)
- Cuerpos de comentarios borrados/eliminados (reemplazados por un placeholder para que la estructura del hilo siga siendo legible)
Ideal para: investigadores, usuarios de IA, cualquiera que trate Reddit como una fuente seria de conocimiento. Si necesitas un hilo limpio para pegar en Claude o leer en Obsidian, este es el camino más limpio. La función estrella es la anidación de los comentarios --- el copia-y-pega la destruye, todos los demás métodos la pierden, Save la mantiene.
Ejemplo de salida
Guardar un hilo popular de r/selfhosted produce:
---
title: "What's your favorite self-hosted app that nobody talks about?"
subreddit: r/selfhosted
author: u/homelabdad
url: https://www.reddit.com/r/selfhosted/comments/abc123/...
score: 1247
comments: 384
date: 2026-03-12
---
## Post
I've been running a homelab for 5 years and the apps that get all the
attention (Plex, Home Assistant, Nextcloud) are great, but the ones I
actually rely on every day are tiny tools nobody mentions. What's yours?
## Top Comments
### u/devops_anna --- 892 points
[Mealie](https://mealie.io) is criminally underrated. Recipe manager
that scrapes from any URL, meal planning, shopping lists. Replaced
three apps for me.
- **u/homelabdad** (OP) --- 124 points
> Just installed it after seeing this. The URL scraper is magic.
- **u/recipe_hoarder** --- 67 points
> Been using it 2 years. The Nextcloud integration is solid too.
### u/raspberry_pi_4 --- 654 points
**Beszel** for monitoring. Lighter than Grafana, prettier than Uptime
Kuma, zero config. Single binary on every host.
- **u/devops_anna** --- 203 points
> Switched from Netdata last month. No regrets.
Ese archivo está a un pegado de ser contexto utilizable para Claude, a una pulsación de ser una nota permanente en Obsidian. La anidación se renderiza correctamente en cualquier visor de Markdown, y las puntuaciones de karma dejan obvio qué ramas importan.
Método 2: la exportación nativa de Reddit (limitada)
Reddit te permite pedir una exportación de la actividad de tu propia cuenta vía Settings → Privacy & Security → Request Data.
Pasos:
- Ve a reddit.com/settings/data-request
- Envía una solicitud GDPR o CCPA
- Espera hasta 30 días un email con un enlace de descarga
- Recibe un ZIP de archivos CSV
Problemas de este enfoque:
- Solo cubre tu propia actividad (posts que hiciste, comentarios que escribiste, items guardados)
- No puedes exportar el hilo de otra persona ni un AMA
- La salida es CSV, no Markdown --- sin estructura, sin anidación, solo filas
- Los cuerpos de los comentarios se vuelcan planos sin relaciones padre-hijo
- La espera de 30 días lo hace inútil para investigación activa
- Sin soporte para exportar un único hilo en contexto
Útil exactamente una vez, cuando quieres respaldar tu propio historial de Reddit. Inútil para todo lo demás.
Método 3: PRAW o la API de Reddit
Para equipos de ingeniería, la API oficial de Reddit (y su excelente wrapper Python PRAW) te permite extraer cualquier hilo de forma programática.
import praw
reddit = praw.Reddit(client_id="...", client_secret="...", user_agent="...")
submission = reddit.submission(url="https://reddit.com/r/.../comments/...")
submission.comments.replace_more(limit=None)
for comment in submission.comments.list():
print(comment.author, comment.score, comment.body)
Ideal para: equipos de ingeniería que construyen pipelines de ingesta de Reddit, datasets de entrenamiento o scrapers de investigación a gran escala.
Problemas de este enfoque:
- La API de Reddit ahora requiere registro y aplica límites de tasa estrictos (desde los cambios de 2023)
- El tier gratuito tope en 100 consultas por minuto por cliente OAuth, duro para hilos profundos con
replace_more - Sin formato Markdown --- obtienes texto en bruto, sin estructura de anidación, sin renderizado del propio Markdown de Reddit
- Construir un árbol a partir de la lista plana de comentarios es un paso aparte
- El uso comercial / de gran volumen requiere un acuerdo de pago con Reddit
Este es el método correcto si estás construyendo un producto. Salvajemente excesivo para un solo hilo.
Método 4: copia del navegador + Pandoc
El fallback manual: copiar el hilo renderizado desde el navegador y reformatearlo.
# After copying the thread to a file as HTML:
pandoc thread.html -f html -t markdown -o thread.md
Ideal para: un rescate puntual de un hilo que necesitas absolutamente ahora, sin herramientas instaladas.
Problemas de este enfoque:
- El copia-y-pega desde Reddit aplana la anidación --- Pandoc no puede recuperar lo que Chrome no incluyó
- Puntuaciones de karma, flair, marcadores OP y timestamps aterrizan en línea como ruido visual
- Las expansiones «Load more comments» hay que hacerlas manualmente antes de copiar
- Los posts con imagen, encuestas y vídeos pierden su contenido por completo
- La salida necesita una edición a mano fuerte para ser usable
Funciona en un apuro con un hilo corto. Se desmorona con cualquier cosa que tenga profundidad.
¿Qué método deberías usar?
| Escenario | Mejor método |
|---|---|
| Pegar un hilo en Claude o ChatGPT | Save --- un clic, anidación preservada |
| Archivar un AMA largo antes de que lo bloqueen | Save --- captura todo el árbol en un solo archivo |
| Citar una cadena específica de comentarios en notas de investigación | Save --- karma + flair + marcadores OP intactos |
| Construir un pipeline interno de ingesta de Reddit | PRAW --- programático, con clave de API en mano |
| Respaldar tu propio historial de Reddit | Exportación de datos de Reddit --- el único método que te da tus propios datos |
| Rescatar un único hilo sin herramientas | Copia + Pandoc --- manual pero funciona sin conexión |
Para la mayoría de la gente --- especialmente quien usa Reddit como contexto de IA o como material de investigación --- Save es la respuesta. Produce el Markdown más limpio sin configuración alguna, y gestiona AMAs de 2.000 comentarios a la misma velocidad que un post de cinco.
Casos límite que Save gestiona
- Comentarios específicos con permalink. Si abres una URL como
/comments/abc/_/xyz/, Reddit muestra solo ese comentario y sus respuestas. Save respeta esto --- captura el subárbol de comentarios desde ese ancla hacia abajo, no el hilo entero. Útil cuando la respuesta que quieres está seis niveles más abajo. - Hilos de comentarios muy profundos. Reddit colapsa los hilos pasada cierta profundidad con «continue this thread». Save sigue esos enlaces y cose de vuelta las ramas profundas, con una indentación que sigue siendo legible en Markdown. En casos extremos (10+ niveles) cambia a un formato plano-con-breadcrumb para que el archivo no se convierta en una barra de scroll horizontal.
- Comentarios borrados y eliminados. Cuando un comentario muestra
[deleted]o[removed], Save mantiene el placeholder para que la estructura del árbol siga intacta. La cadena de respuestas por debajo se preserva --- puedes seguir leyendo las respuestas aunque el comentario original ya no esté. - old.reddit.com vs new.reddit.com. Ambos diseños funcionan. Save detecta automáticamente en cuál estás y parsea en consecuencia.
old.reddittiende a dar una salida ligeramente más limpia porque el DOM es más simple, peronew.redditfunciona bien. - Subreddits privados y restringidos. Save ve lo que ve tu navegador con sesión iniciada. Si estás aprobado en un sub privado, Save puede capturar hilos ahí. Si no puedes verlo tú, Save tampoco.
- Hilos archivados. Reddit archiva los hilos pasados 6 meses y bloquea los nuevos comentarios. Save los captura idénticamente --- el estado de archivado no cambia el parsing.
- Encuestas y posts con imagen. Los resultados de las encuestas (recuentos actuales de votos, opciones) se capturan como una lista. Los posts con imagen incluyen la URL de la imagen y el texto alt en el frontmatter. Los posts con vídeo incluyen la URL del vídeo y la transcripción automática si Reddit generó una.
- Crossposts. Cuando un hilo es un crosspost, Save enlaza al original y captura la discusión que está ocurriendo en el crosspost actual, no en la fuente.
Combínalo con tu workflow
La salida Markdown funciona donde la necesites:
- Claude / ChatGPT / Gemini --- pega el archivo, haz preguntas de seguimiento como «¿cuál es la recomendación de producto consensuada?» o «resume los tres principales caminos de troubleshooting»
- Obsidian --- mételo en tu vault, enlázalo a notas relacionadas, busca a través de cada hilo que has guardado sobre un tema
- Notion --- pega directamente, la estructura anidada de comentarios se renderiza como toggles
- Apple Notes --- importación limpia vía la extensión de compartir de Markdown
- Save Vault --- si has conectado una, cada save de Reddit aterriza ahí automáticamente con backlinks y tags de subreddit
FAQ
¿Save funciona en el sitio móvil o app de Reddit? La extensión es solo Chrome desktop por ahora. En móvil, copia la URL y ábrela en escritorio, o compártela a una Save Vault en Mac (que tiene un handler de URL).
¿Y el nuevo rediseño de Reddit con comentarios de scroll infinito? Save gestiona tanto el diseño clásico como el rediseñado. En el nuevo Reddit, dispara las expansiones «load more comments» automáticamente antes de parsear, así que no tienes que hacer scroll por todo el hilo primero.
¿Puedo guardar solo el post original, sin los comentarios? Sí. La extensión te deja elegir: solo post, post + top comentarios, o hilo completo. El valor por defecto es post + top comentarios, porque normalmente es lo que realmente quieres.
¿Preserva el formato Markdown de Reddit en los comentarios? Sí. Negrita, cursiva, enlaces, bloques de código, blockquotes y listas en los comentarios se mantienen como Markdown en la salida --- ya eran Markdown del lado de Reddit.
¿Cómo gestiona hilos con miles de comentarios? Save captura primero las ramas con más puntuación y baja por puntuación. En un AMA de 2.000 comentarios, la salida por defecto mantiene las primeras 200 cadenas de comentarios aproximadamente --- las que tienen karma por encima del umbral. Puedes configurar la profundidad y el umbral en los ajustes de la extensión si quieres todo o solo lo más alto.
¿Y los hilos NSFW? Save los captura idénticamente a cualquier otro hilo --- no filtra por tag NSFW. Si puedes ver el hilo, Save puede guardarlo.
¿La puntuación de karma es exacta en el momento de guardar? Sí, las puntuaciones se capturan en el momento en que haces clic en Save. Reddit redondea de forma difusa las puntuaciones grandes («12.4k») en la página; Save usa el entero exacto cuando la API lo expone, si no, mantiene el valor redondeado que se muestra.
¿Cuánto cuesta? Save tiene un tier gratuito para que puedas probarlo en unos cuantos hilos. Después, una pequeña suscripción cubre los costes de parsing y almacenamiento.
Guías relacionadas de Save
- Save YouTube Videos as Markdown --- transcripción IA, resumen, timestamps
- Save Twitter / X Threads as Markdown --- cada tweet, en orden, con atribución
- Save Hacker News Threads as Markdown --- discusiones anidadas con karma intacto
- Save ChatGPT Conversations as Markdown --- cada turno, con bloques de código intactos
## Continue reading
Cómo guardar una conversación de ChatGPT como Markdown (cada turno, bloques de código intactos)
Convierte cualquier conversación de ChatGPT a Markdown limpio: cada turno, bloques de código, tablas, citas. Guía completa 2026 para investigadores y usuarios de IA.
Cómo guardar un hilo de Twitter / X como Markdown (hilo completo, en orden)
Convierte cualquier hilo de Twitter o X a Markdown limpio: cada tweet en orden de publicación, con autoría, marcas de tiempo y quote-tweets anidados. Guía 2026.
Cómo guardar un vídeo de YouTube como Markdown (transcripción, resumen, marcas de tiempo)
Convierte cualquier vídeo de YouTube a Markdown limpio: transcripción con IA, resumen, marcas de tiempo y capítulos. Guía completa 2026 para investigadores y usuarios de IA.
Cómo guardar una conversación de Claude en Markdown (Artifacts, citas, Projects)
Convierte conversaciones de Claude a Markdown limpio: cada turno, Artifacts como bloques de código, citas preservadas. Guía completa para investigadores y usuarios de IA.
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.