어떤 웹페이지든 마크다운으로 저장하는 방법 (3가지)
웹페이지를 마크다운 파일로 저장하고 싶으신가요? 지식 기반을 구축하거나, 문서를 보관하거나, 단순히 깔끔한 기사 사본을 원할 수도 있습니다. 가장 간단한 방법부터 가장 기술적인 방법까지, 세 가지 방법을 소개합니다.
방법 1: Save 확장 프로그램 (가장 쉬움)
Save는 어떤 웹페이지든 한 번의 클릭으로 깔끔한 Markdown으로 변환해주는 Chrome 확장 프로그램입니다.
작동 방식:
- Chrome 웹 스토어에서 Save 설치
- 아무 웹페이지나 방문
- Save 아이콘 클릭
.md파일이 컴퓨터로 다운로드됩니다.
장점:
- AI 기반 추출 기능으로 광고, 내비게이션, 불필요한 요소 제거
- 제목, 목록, 코드 블록, 표, 링크 보존
- 어려운 페이지에서도 작동: YouTube (전체 스크립트), Twitter 스레드, Reddit, Confluence, 유료 콘텐츠
- 터미널, API 키, 설정 불필요
- Obsidian, VS Code 또는 AI 도구에서 바로 사용할 수 있는 깔끔하고 구조화된 Markdown 출력
가장 적합한 대상: 터미널을 사용하지 않고 깔끔한 Markdown을 원하는 모든 사람.
방법 2: 명령줄 도구
몇 가지 CLI 도구는 HTML을 Markdown으로 변환합니다:
Pandoc
문서 변환의 스위스 아미 나이프:
# From a URL (fetch + convert)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md
# From a local HTML file
pandoc input.html -o output.md
장점: 강력하고 복잡한 문서를 처리하며 다양한 출력 형식을 지원합니다. 단점: 원본 HTML을 가져옵니다 (내비게이션, 광고, 스크립트 포함). 출력물은 종종 수동 정리가 필요합니다.
Defuddle
읽기 가능한 콘텐츠 추출에 중점을 둔 새로운 도구:
npm install -g defuddle
defuddle parse https://example.com/article --md
장점: 내비게이션과 불필요한 요소를 제거하고 기사 콘텐츠에 집중합니다. 단점: Node.js가 필요하며 모든 페이지 유형을 처리하지는 못합니다.
Jina Reader
Markdown을 반환하는 호스팅 API:
curl -s "https://r.jina.ai/https://example.com/article"
장점: 설치가 필요 없고 HTTP를 통해 작동합니다. 단점: 속도 제한이 있고, 인터넷이 필요하며, 타사 종속성이 있고, JavaScript로 렌더링된 페이지를 잘 처리하지 못합니다.
가장 적합한 대상: 터미널 사용에 익숙하고 페이지를 일괄 변환해야 하는 개발자.
방법 3: 수동 복사-붙여넣기
로우테크 방식:
- 페이지의 모든 콘텐츠 선택 (Cmd+A 또는 Ctrl+A)
- 복사 (Cmd+C 또는 Ctrl+C)
- Markdown 편집기에 붙여넣기
- 서식 수동 수정
장점: 도구가 필요 없습니다. 단점: 모든 것을 복사합니다 (내비게이션, 광고, 푸터). 서식이 손실됩니다. 표가 깨집니다. 코드 블록이 사라집니다. 링크가 일반 텍스트가 됩니다. 짧은 기사 외에는 시간이 많이 소요됩니다.
가장 적합한 대상: 몇 단락만 필요한 일회성 저장.
비교
| 기능 | Save 확장 프로그램 | CLI 도구 | 복사-붙여넣기 |
|---|---|---|---|
| 설정 시간 | 10초 | 5-30분 | 없음 |
| 원클릭 저장 | 예 | 아니요 | 아니요 |
| 깔끔한 출력 | AI 추출 | 다양함 | 수동 정리 |
| YouTube 스크립트 | 예 | 아니요 | 아니요 |
| Twitter 스레드 | 예 | 아니요 | 부분적 |
| Confluence/위키 | 예 | 부분적 | 지저분함 |
| 코드 블록 보존 | 예 | 보통 | 아니요 |
| 표 보존 | 예 | 보통 | 아니요 |
| 오프라인 작동 | 아니요 | 예 (Pandoc) | 예 |
| 비용 | 무료 티어 사용 가능 | 무료 | 무료 |
웹페이지를 Markdown으로 저장해야 하는 이유?
이 글을 읽고 계시다면 이미 알고 계실 겁니다. 하지만 웹 콘텐츠를 저장하는 데 있어 Markdown이 다른 모든 형식을 능가하는 이유를 소개합니다:
매우 작습니다. 일반적인 기사는 Markdown으로 5KB인 반면 HTML로는 100KB 이상입니다. 이는 저장 공간이 20배 적고, AI에 입력할 경우 토큰도 20배 적게 듭니다.
휴대성이 뛰어납니다. 어떤 텍스트 편집기, 어떤 노트 앱 (Obsidian, Notion, Logseq), 어떤 개발자 도구에서도 열 수 있습니다. 벤더 종속성이 없습니다.
검색이 가능합니다. 수백 개의 Markdown 파일을 밀리초 만에 grep으로 검색할 수 있습니다. PDF로는 그렇게 하기 어려울 겁니다.
LLM이 선호합니다. Claude, ChatGPT 및 기타 AI 도구는 수백만 개의 Markdown 문서로 훈련되었습니다. Markdown을 입력하면 원본 HTML이나 PDF보다 더 나은 결과를 얻을 수 있습니다.
영원히 지속됩니다. 일반 텍스트 파일은 가장 내구성이 뛰어난 디지털 형식입니다. .md 파일은 50년 후에도 읽을 수 있을 것입니다. 북마크는 5년도 버티지 못할 겁니다.
시작하기
웹페이지를 Markdown으로 저장하는 가장 빠른 방법: Chrome 웹 스토어에서 Save를 설치하세요. 무료로 시작할 수 있으며 설치하는 데 10초밖에 걸리지 않습니다.
다시는 웹페이지를 잃어버리지 마세요. Save는 어떤 페이지든 한 번의 클릭으로 깔끔한 Markdown으로 변환합니다.