← 블로그로 돌아가기

뉴스 기사를 Markdown으로 저장하는 방법

· Save Team
newsarticlesjournalismarchive

뉴스 사이트는 웹에서 가장 지저분한 페이지 중 하나입니다 — 실제 기사를 광고, 팝업, 뉴스레터 구독 유도, 쿠키 배너, 자동 재생 동영상이 둘러싸고 있습니다. 저널리즘만 깔끔한 Markdown으로 추출하는 방법을 소개합니다.

뉴스 기사를 Markdown으로 저장해야 하는 이유

뉴스 콘텐츠에는 고유한 보존 문제가 있습니다:

  • 기사가 페이월 뒤로 이동 — 오늘은 무료, 내일은 잠김
  • 콘텐츠가 조용히 업데이트됨 — 공지 없이 스토리 변경
  • 사이트가 리디자인됨 — 오래된 기사 링크가 깨짐
  • 잡동사니가 압도 — 광고, 트래커, 팝업으로 읽기 고통스러움
  • 개인 아카이브 없음 — URL이 변경되면 북마크도 사라짐

Save가 캡처하는 것

기사 콘텐츠

  • 제목과 부제목
  • 단락 구조가 있는 전체 기사 본문
  • 작성자와 게시 날짜
  • 인용구와 강조된 텍스트
  • 핵심 데이터 포인트와 통계
  • 출처 표시

Save가 제거하는 것

  • 디스플레이 광고와 스폰서 콘텐츠
  • 내비게이션 메뉴와 푸터
  • 쿠키 동의 배너
  • 뉴스레터 구독 신청
  • 관련 기사 사이드바
  • 자동 재생 동영상 플레이어
  • 소셜 공유 버튼

출력 예시

# 기술 대기업들, AI 인프라 지출 기록 달성

**출처:** The Information
**작성자:** Sarah Chen
**게시:** 2026년 3월 28일

---

5대 기술 대기업은 이번 주 발표된 실적 보고서에 따르면
2026년 1분기에 합계 870억 달러를 AI 인프라에 지출했으며,
이는 전년 동기 대비 340% 증가한 수치입니다.

사용 사례

개인 뉴스 아카이브

  • 매주 읽는 가장 중요한 기사 저장
  • 주제별로 정리된 검색 가능한 아카이브 구축
  • 나중에 페이월 뒤로 이동하는 기사에 대한 접근 유지

리서치 및 분석

  • 여러 매체에서 주제에 대한 커버리지 수집
  • 며칠, 몇 주에 걸쳐 스토리가 어떻게 진화하는지 추적
  • 보고서와 프레젠테이션을 위한 소스 자료 구축

AI 기반 브리핑

  • 기사를 저장하고 AI에 제공해 일일 브리핑 생성
  • AI에게 여러 소스의 커버리지 합성 요청
  • 개인 뉴스 라이브러리에서 요약 생성

최선의 결과를 위한 팁

  1. 대부분의 뉴스 사이트에서 작동 — NYT, WSJ, BBC, Bloomberg, The Guardian, TechCrunch, The Verge, Ars Technica 등
  2. 페이월 기사 — 콘텐츠를 볼 수 있다면(구독 또는 무료 기사), Save가 캡처 가능
  3. 독자 모드 우회 — Save의 AI 추출이 브라우저 독자 모드보다 더 철저함
  4. 원본에서 저장 — Apple News나 Google News 리디렉션이 아닌 기사 URL에서 저장

시작하기

Chrome Web Store에서 Save 설치 — 뉴스 아카이브를 구축하세요.


질문이 있으신가요? [email protected]로 연락하세요