← 블로그로 돌아가기

어떤 웹페이지든 마크다운으로 저장하는 방법 (3가지)

· Save Team
markdownweb-clipperhow-toproductivity

웹페이지를 마크다운 파일로 저장하고 싶으신가요? 지식 기반을 구축하거나, 문서를 보관하거나, 단순히 깔끔한 기사 사본을 원할 수도 있습니다. 가장 간단한 방법부터 가장 기술적인 방법까지, 세 가지 방법을 소개합니다.

방법 1: Save 확장 프로그램 (가장 쉬움)

Save는 어떤 웹페이지든 한 번의 클릭으로 깔끔한 Markdown으로 변환해주는 Chrome 확장 프로그램입니다.

작동 방식:

  1. Chrome 웹 스토어에서 Save 설치
  2. 아무 웹페이지나 방문
  3. Save 아이콘 클릭
  4. .md 파일이 컴퓨터로 다운로드됩니다.

장점:

  • AI 기반 추출 기능으로 광고, 내비게이션, 불필요한 요소 제거
  • 제목, 목록, 코드 블록, 표, 링크 보존
  • 어려운 페이지에서도 작동: YouTube (전체 스크립트), Twitter 스레드, Reddit, Confluence, 유료 콘텐츠
  • 터미널, API 키, 설정 불필요
  • Obsidian, VS Code 또는 AI 도구에서 바로 사용할 수 있는 깔끔하고 구조화된 Markdown 출력

가장 적합한 대상: 터미널을 사용하지 않고 깔끔한 Markdown을 원하는 모든 사람.

방법 2: 명령줄 도구

몇 가지 CLI 도구는 HTML을 Markdown으로 변환합니다:

Pandoc

문서 변환의 스위스 아미 나이프:

# From a URL (fetch + convert)
curl -s https://example.com/article | pandoc -f html -t markdown -o article.md

# From a local HTML file
pandoc input.html -o output.md

장점: 강력하고 복잡한 문서를 처리하며 다양한 출력 형식을 지원합니다. 단점: 원본 HTML을 가져옵니다 (내비게이션, 광고, 스크립트 포함). 출력물은 종종 수동 정리가 필요합니다.

Defuddle

읽기 가능한 콘텐츠 추출에 중점을 둔 새로운 도구:

npm install -g defuddle
defuddle parse https://example.com/article --md

장점: 내비게이션과 불필요한 요소를 제거하고 기사 콘텐츠에 집중합니다. 단점: Node.js가 필요하며 모든 페이지 유형을 처리하지는 못합니다.

Jina Reader

Markdown을 반환하는 호스팅 API:

curl -s "https://r.jina.ai/https://example.com/article"

장점: 설치가 필요 없고 HTTP를 통해 작동합니다. 단점: 속도 제한이 있고, 인터넷이 필요하며, 타사 종속성이 있고, JavaScript로 렌더링된 페이지를 잘 처리하지 못합니다.

가장 적합한 대상: 터미널 사용에 익숙하고 페이지를 일괄 변환해야 하는 개발자.

방법 3: 수동 복사-붙여넣기

로우테크 방식:

  1. 페이지의 모든 콘텐츠 선택 (Cmd+A 또는 Ctrl+A)
  2. 복사 (Cmd+C 또는 Ctrl+C)
  3. Markdown 편집기에 붙여넣기
  4. 서식 수동 수정

장점: 도구가 필요 없습니다. 단점: 모든 것을 복사합니다 (내비게이션, 광고, 푸터). 서식이 손실됩니다. 표가 깨집니다. 코드 블록이 사라집니다. 링크가 일반 텍스트가 됩니다. 짧은 기사 외에는 시간이 많이 소요됩니다.

가장 적합한 대상: 몇 단락만 필요한 일회성 저장.

비교

기능Save 확장 프로그램CLI 도구복사-붙여넣기
설정 시간10초5-30분없음
원클릭 저장아니요아니요
깔끔한 출력AI 추출다양함수동 정리
YouTube 스크립트아니요아니요
Twitter 스레드아니요부분적
Confluence/위키부분적지저분함
코드 블록 보존보통아니요
표 보존보통아니요
오프라인 작동아니요예 (Pandoc)
비용무료 티어 사용 가능무료무료

웹페이지를 Markdown으로 저장해야 하는 이유?

이 글을 읽고 계시다면 이미 알고 계실 겁니다. 하지만 웹 콘텐츠를 저장하는 데 있어 Markdown이 다른 모든 형식을 능가하는 이유를 소개합니다:

매우 작습니다. 일반적인 기사는 Markdown으로 5KB인 반면 HTML로는 100KB 이상입니다. 이는 저장 공간이 20배 적고, AI에 입력할 경우 토큰도 20배 적게 듭니다.

휴대성이 뛰어납니다. 어떤 텍스트 편집기, 어떤 노트 앱 (Obsidian, Notion, Logseq), 어떤 개발자 도구에서도 열 수 있습니다. 벤더 종속성이 없습니다.

검색이 가능합니다. 수백 개의 Markdown 파일을 밀리초 만에 grep으로 검색할 수 있습니다. PDF로는 그렇게 하기 어려울 겁니다.

LLM이 선호합니다. Claude, ChatGPT 및 기타 AI 도구는 수백만 개의 Markdown 문서로 훈련되었습니다. Markdown을 입력하면 원본 HTML이나 PDF보다 더 나은 결과를 얻을 수 있습니다.

영원히 지속됩니다. 일반 텍스트 파일은 가장 내구성이 뛰어난 디지털 형식입니다. .md 파일은 50년 후에도 읽을 수 있을 것입니다. 북마크는 5년도 버티지 못할 겁니다.

시작하기

웹페이지를 Markdown으로 저장하는 가장 빠른 방법: Chrome 웹 스토어에서 Save를 설치하세요. 무료로 시작할 수 있으며 설치하는 데 10초밖에 걸리지 않습니다.


다시는 웹페이지를 잃어버리지 마세요. Save는 어떤 페이지든 한 번의 클릭으로 깔끔한 Markdown으로 변환합니다.