Reddit 스레드를 Markdown으로 저장하는 방법 (댓글과 맥락 포함)

·

Reddit은 진짜 답이 사는 곳입니다 --- 실제로 문제를 해결해 준 트러블슈팅 스레드, 4년 전에 묻힌 AMA, 전문가들이 모이는 틈새 서브레딧. 하지만 Reddit은 가져갈 수 있는 것을 아무것도 주지 않습니다. 내보내기도, “다른 이름으로 저장” 버튼도, 댓글 맥락을 그대로 유지한 채 스레드를 끄집어낼 방법도 없습니다. 복사-붙여넣기는 중첩 구조를 평탄화하고 카르마를 벗겨냅니다. Reddit 스레드를 Claude나 ChatGPT에 던져보려고 한 적이 있다면 그 문제를 알 것입니다 --- URL을 붙여넣어도 모델에는 아무것도 전달되지 않고, 보이는 텍스트를 붙여넣으면 스레드가 읽을 가치가 있게 만든 구조가 사라집니다.

이 가이드는 Reddit 스레드를 깔끔한 Markdown으로 변환하는 모든 방법을 다룹니다 --- 짧은 질문 게시글부터 댓글 2,000개짜리 AMA까지.

왜 Reddit 스레드를 Markdown으로 저장해야 할까?

Reddit 콘텐츠는 독특하게 취약하고, 독특하게 연구 자료로 가치 있습니다:

  • LLM에 먹이기 --- Claude, ChatGPT, Gemini, 로컬 모델 모두 컨텍스트로 Markdown을 네이티브로 읽습니다
  • 사라지기 전에 보관 --- 사용자가 계정을 폭파하고, 모더레이터가 게시글을 제거하며, 서브레딧이 하룻밤 사이에 비공개로 전환됩니다
  • 특정 댓글 체인 인용 --- 답은 거의 최상위 댓글이 아니고, 보통 세 단계 깊이의 답글에 있습니다
  • Obsidian이나 Notion으로 가져가기 --- 한 파일, 완전히 검색 가능, 토론 구조 그대로
  • 개인 지식 베이스 구축 --- 제품 추천, 트러블슈팅, AMA, 틈새 전문성

2026년 Reddit-Markdown 트래픽 대부분을 견인하는 사용 사례는 첫 번째입니다: 사람들은 LLM에게 500개 댓글 스레드를 요약하거나 합의된 답을 찾거나 가장 추천받은 권장사항을 추출해 달라고 하고 싶어합니다. URL 붙여넣기는 작동하지 않고, 원시 HTML 붙여넣기는 컨텍스트 윈도우를 채워버립니다.

방법 1: Save (가장 빠른, 원클릭)

Save는 어떤 Reddit 스레드든 한 번의 클릭으로 Markdown 파일로 만드는 Chrome 확장 프로그램입니다. 댓글 트리를 걸어가며 중첩을 보존하고, 텍스트 벽이 아닌 구조화된 토론처럼 읽히는 파일을 만들어 냅니다.

작동 방식:

  1. Chrome에서 Reddit 스레드를 엽니다 (old.reddit.comwww.reddit.com 둘 다 동작)
  2. 툴바의 Save 확장 아이콘을 클릭합니다
  3. .md 파일이 즉시 다운로드됩니다 (연결되어 있다면 Save Vault로 들어갑니다)

얻는 것:

  • 상단에 원본 게시글 본문, 제목, 서브레딧, 작성자, 점수
  • 가장 높은 점수의 댓글 가지, 답글의 전체 중첩 보존
  • 모든 댓글의 카르마 점수, 플레어, OP 표시
  • URL, 서브레딧, 게시일, 전체 댓글 수가 들어간 frontmatter
  • 전체 스레드가 한 파일에 --- 게시글과 댓글이 함께, 두 개의 내보내기가 아니라

제거되는 것:

  • 사이드바 위젯, 서브레딧 규칙, 추천 게시글
  • 프로모션 게시글과 댓글 사이의 광고 슬롯
  • Reddit의 네비게이션 크롬, 푸터, “What are your thoughts?” 프롬프트
  • AutoModerator 고정 댓글 (명시적으로 옵트인하지 않는 한)
  • 삭제/제거된 댓글 본문 (스레드 구조가 읽기 쉽게 유지되도록 플레이스홀더로 대체)

가장 적합: 연구자, AI 사용자, Reddit을 진지한 지식 소스로 다루는 모두. Claude에 붙여넣거나 Obsidian에서 읽을 깔끔한 스레드가 필요하다면 이게 가장 깔끔한 길입니다. 킬러 기능은 댓글 중첩입니다 --- 복사-붙여넣기는 그것을 파괴하고, 다른 모든 방법은 그것을 잃지만, Save는 그것을 유지합니다.

출력 예시

인기 있는 r/selfhosted 스레드를 저장하면 다음과 같이 나옵니다:

---
title: "What's your favorite self-hosted app that nobody talks about?"
subreddit: r/selfhosted
author: u/homelabdad
url: https://www.reddit.com/r/selfhosted/comments/abc123/...
score: 1247
comments: 384
date: 2026-03-12
---

## Post

I've been running a homelab for 5 years and the apps that get all the
attention (Plex, Home Assistant, Nextcloud) are great, but the ones I
actually rely on every day are tiny tools nobody mentions. What's yours?

## Top Comments

### u/devops_anna --- 892 points
[Mealie](https://mealie.io) is criminally underrated. Recipe manager
that scrapes from any URL, meal planning, shopping lists. Replaced
three apps for me.

  - **u/homelabdad** (OP) --- 124 points
    > Just installed it after seeing this. The URL scraper is magic.

  - **u/recipe_hoarder** --- 67 points
    > Been using it 2 years. The Nextcloud integration is solid too.

### u/raspberry_pi_4 --- 654 points
**Beszel** for monitoring. Lighter than Grafana, prettier than Uptime
Kuma, zero config. Single binary on every host.

  - **u/devops_anna** --- 203 points
    > Switched from Netdata last month. No regrets.

그 파일은 한 번의 붙여넣기만에 Claude의 사용 가능한 컨텍스트가 되고, 한 번의 키 입력만에 영구적인 Obsidian 노트가 됩니다. 중첩은 어떤 Markdown 뷰어에서도 올바르게 렌더링되며, 카르마 점수는 어떤 가지가 중요한지 명백하게 만듭니다.

방법 2: Reddit의 네이티브 내보내기 (제한적)

Reddit은 Settings → Privacy & Security → Request Data에서 자신의 계정 활동에 대한 데이터 내보내기를 요청할 수 있게 해줍니다.

단계:

  1. reddit.com/settings/data-request로 이동
  2. GDPR 또는 CCPA 요청 제출
  3. 다운로드 링크가 담긴 이메일을 최대 30일 기다림
  4. CSV 파일이 든 ZIP 수신

이 접근의 문제:

  • 자신의 활동만 다룸 (작성한 게시글, 작성한 댓글, 저장한 항목)
  • 다른 사람의 스레드나 AMA는 내보낼 수 없음
  • 출력이 Markdown이 아닌 CSV --- 구조도, 중첩도 없고, 그냥 행만
  • 댓글 본문이 부모-자식 관계 없이 평평하게 덤프됨
  • 30일 대기는 활동적인 연구에는 쓸모없게 만듦
  • 컨텍스트 안에서 단일 스레드를 내보내는 지원 없음

자신의 Reddit 히스토리를 백업하고 싶을 때 정확히 한 번 유용. 다른 모든 것에는 쓸모없음.

방법 3: PRAW 또는 Reddit API

엔지니어링 팀의 경우, Reddit의 공식 API(그리고 그 훌륭한 Python 래퍼 PRAW)를 통해 어떤 스레드든 프로그래밍 방식으로 끌어올 수 있습니다.

import praw

reddit = praw.Reddit(client_id="...", client_secret="...", user_agent="...")
submission = reddit.submission(url="https://reddit.com/r/.../comments/...")
submission.comments.replace_more(limit=None)

for comment in submission.comments.list():
    print(comment.author, comment.score, comment.body)

가장 적합: Reddit 수집 파이프라인, 학습 데이터셋, 대규모 연구 스크레이퍼를 구축하는 엔지니어링 팀.

이 접근의 문제:

  • Reddit API는 이제 등록을 요구하고 엄격한 레이트 제한을 강제합니다 (2023년 변경 이후)
  • 무료 티어는 OAuth 클라이언트당 분당 100쿼리로 캡, replace_more를 쓰는 깊은 스레드에는 가혹
  • Markdown 포맷팅 없음 --- 원시 텍스트만 얻고, 중첩 구조도, Reddit 자체의 Markdown 렌더링도 없음
  • 평평한 댓글 리스트로부터 트리를 만드는 건 별도의 단계
  • 상업적 / 대용량 사용은 Reddit과의 유료 계약을 요구

제품을 만들고 있다면 이게 올바른 방법입니다. 단일 스레드에는 과도하게 오버킬.

방법 4: 브라우저 복사 + Pandoc

수동 폴백: 브라우저에서 렌더링된 스레드를 복사하고 다시 포맷팅합니다.

# After copying the thread to a file as HTML:
pandoc thread.html -f html -t markdown -o thread.md

가장 적합: 도구가 아무것도 설치되어 있지 않은 상태에서 지금 절대 필요한 스레드의 일회성 구조.

이 접근의 문제:

  • Reddit에서의 복사-붙여넣기는 중첩을 평탄화 --- Chrome이 포함하지 않은 것을 Pandoc은 복원할 수 없음
  • 카르마 점수, 플레어, OP 표시, 타임스탬프가 인라인에 시각적 노이즈로 들어옴
  • “Load more comments” 확장은 복사 전에 수동으로 일어나야 함
  • 이미지 게시글, 투표, 동영상 게시글은 콘텐츠를 완전히 잃음
  • 사용 가능하려면 출력에 과도한 수작업 편집이 필요

짧은 스레드에서는 응급으로 작동. 깊이 있는 어떤 것에서든 무너집니다.

어떤 방법을 사용해야 할까?

시나리오최적 방법
스레드를 Claude나 ChatGPT에 붙여넣기Save --- 원클릭, 중첩 보존
잠기기 전에 긴 AMA 보관Save --- 전체 트리를 한 파일에 캡처
연구 노트에 특정 댓글 체인 인용Save --- 카르마 + 플레어 + OP 표시 무결
내부 Reddit 수집 파이프라인 구축PRAW --- 프로그래밍 방식, API 키를 손에 들고
자신의 Reddit 히스토리 백업Reddit 데이터 내보내기 --- 자신의 데이터를 주는 유일한 방법
도구 없이 단일 스레드 구조복사 + Pandoc --- 수동이지만 오프라인에서 작동

대부분의 사람들 --- 특히 Reddit을 AI 컨텍스트나 연구 자료로 사용하는 누구나 --- 에게 Save가 답입니다. 설정 없이 가장 깔끔한 Markdown을 생성하고, 2,000개 댓글 AMA를 다섯 개 댓글 게시글과 같은 속도로 처리합니다.

Save가 처리하는 엣지 케이스

  • 퍼머링크된 특정 댓글. /comments/abc/_/xyz/와 같은 URL을 열면 Reddit은 그 댓글과 그것의 답글만 보여줍니다. Save는 이를 존중합니다 --- 그 앵커에서 아래로 댓글 하위 트리를 캡처하지, 전체 스레드는 아닙니다. 원하는 답이 6단계 깊이에 있을 때 유용합니다.
  • 매우 깊은 댓글 스레드. Reddit은 일정 깊이를 넘어선 스레드를 “continue this thread”로 접습니다. Save는 그 링크들을 따라가서 깊은 가지들을 다시 꿰매며, Markdown에서 읽기 쉬운 채로 들여쓰기를 유지합니다. 극단적인 경우(10+ 단계)에는 파일이 가로 스크롤바가 되지 않도록 평평한 빵부스러기 형식으로 전환합니다.
  • 삭제되고 제거된 댓글. 댓글이 [deleted] 또는 [removed]로 표시될 때, Save는 트리 구조가 무결하게 유지되도록 플레이스홀더를 유지합니다. 아래의 답글 체인은 보존됩니다 --- 원래 댓글이 사라졌어도 답글은 여전히 읽을 수 있습니다.
  • old.reddit.com vs new.reddit.com. 두 레이아웃 모두 작동합니다. Save는 어느 것에 있는지 자동 감지하여 그에 따라 파싱합니다. old.reddit은 DOM이 더 단순해서 약간 더 깨끗한 출력을 주는 경향이 있지만, new.reddit도 문제없이 작동합니다.
  • 비공개 및 제한된 서브레딧. Save는 로그인된 브라우저가 보는 것을 봅니다. 비공개 서브에서 승인되었다면, Save는 거기 스레드를 캡처할 수 있습니다. 당신이 볼 수 없다면 Save도 볼 수 없습니다.
  • 보관된 스레드. Reddit은 6개월 후 스레드를 보관하고 새 댓글을 잠급니다. Save는 그것들을 동일하게 캡처합니다 --- 보관 상태는 파싱을 바꾸지 않습니다.
  • 투표와 이미지 게시글. 투표 결과(현재 투표 수, 옵션)는 리스트로 캡처됩니다. 이미지 게시글은 frontmatter에 이미지 URL과 alt 텍스트를 포함합니다. 동영상 게시글은 동영상 URL과 Reddit이 생성한 경우 자동 전사를 포함합니다.
  • 크로스포스트. 스레드가 크로스포스트일 때, Save는 원본으로 링크하고 소스가 아닌 현재 크로스포스트에서 일어나고 있는 토론을 캡처합니다.

워크플로우와 짝지으세요

Markdown 출력은 필요한 곳 어디서나 작동합니다:

  • Claude / ChatGPT / Gemini --- 파일을 붙여넣고 “합의된 제품 추천은 무엇인가?” 또는 “상위 세 가지 트러블슈팅 경로를 요약해 줘”와 같은 후속 질문을 하기
  • Obsidian --- 볼트에 떨어뜨리고, 관련 노트에 링크하고, 한 주제에 대해 저장한 모든 스레드에서 검색
  • Notion --- 직접 붙여넣기, 중첩된 댓글 구조가 토글로 렌더링됨
  • Apple Notes --- Markdown 공유 확장을 통한 깔끔한 가져오기
  • Save Vault --- 연결되어 있다면 모든 Reddit 저장이 백링크와 서브레딧 태그와 함께 자동으로 거기 들어갑니다

FAQ

Save가 Reddit 모바일 사이트나 앱에서 작동하나요? 확장은 현재 데스크톱 Chrome 전용입니다. 모바일에서는 URL을 복사하여 데스크톱에서 열거나, Mac의 Save Vault(URL 핸들러 있음)로 공유하세요.

무한 스크롤 댓글이 있는 새로운 Reddit 리디자인은 어떤가요? Save는 클래식과 리디자인 레이아웃 모두를 처리합니다. 새 Reddit에서는 파싱 전에 자동으로 “load more comments” 확장을 트리거하므로, 먼저 전체 스레드를 스크롤할 필요가 없습니다.

댓글 없이 원본 게시글만 저장할 수 있나요? 네. 확장은 선택을 허용합니다: 게시글만, 게시글 + 상위 댓글, 또는 전체 스레드. 기본값은 게시글 + 상위 댓글로, 보통 실제로 원하는 것이기 때문입니다.

댓글에서 Reddit Markdown 포맷팅을 보존하나요? 네. 댓글의 굵게, 기울임꼴, 링크, 코드 블록, 블록인용, 리스트는 출력에 Markdown으로 유지됩니다 --- 그것들은 Reddit 쪽에서 처음부터 Markdown이었습니다.

수천 개의 댓글이 있는 스레드를 어떻게 처리하나요? Save는 가장 높은 점수의 가지를 먼저 캡처하고 점수순으로 내려갑니다. 2,000개 댓글 AMA에서, 기본 출력은 상위 200개 정도의 댓글 체인을 유지합니다 --- 임계값을 넘는 카르마를 가진 것들. 모든 것이 필요하거나 최상위만 필요한 경우 확장 설정에서 깊이와 임계값을 구성할 수 있습니다.

NSFW 스레드는요? Save는 다른 스레드와 동일하게 캡처합니다 --- NSFW 태그로 필터링하지 않습니다. 스레드를 볼 수 있다면 Save가 저장할 수 있습니다.

저장 시점에 카르마 점수가 정확한가요? 네, 점수는 Save를 클릭한 순간에 캡처됩니다. Reddit은 페이지에서 큰 점수(“12.4k”)를 모호하게 반올림합니다; Save는 API가 노출하면 정확한 정수를 사용하고, 그렇지 않으면 표시된 반올림된 값을 유지합니다.

얼마 정도 드나요? Save는 몇 개의 스레드에서 시도해 볼 수 있는 무료 티어가 있습니다. 그 이후에는 작은 구독이 파싱과 저장 비용을 커버합니다.

관련 Save 가이드

## Continue reading

Jean-Sébastien Wallez

Written by

Jean-Sébastien Wallez

I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.

## try save

더 스마트하게 저장할 준비가 되셨나요?

클릭 한 번으로 모든 웹페이지를 Markdown으로 변환하세요.

Chrome에 추가 🐿️