Как сохранить видео с YouTube в Markdown (расшифровка, резюме, тайм-коды)

·

YouTube не хочет, чтобы вы уходили с контентом. Нет кнопки экспорта, нет загрузки расшифровки, нет опции «скопировать в заметки». Боковая панель с субтитрами выдаёт сырые блоки субтитров без пунктуации. Если вы когда-нибудь пытались бросить YouTube-видео в Claude или ChatGPT в качестве контекста, вы знаете проблему --- вставка URL не даёт модели ничего, потому что модель не может смотреть.

Этот гид охватывает все методы конвертации YouTube-видео в чистый Markdown --- от одного доклада до многочасового подкаста.

Зачем сохранять видео с YouTube в Markdown?

Markdown --- это формат, который работает везде, куда нужно поместить расшифровку:

  • Скормить LLM --- Claude, ChatGPT, Gemini и локальные модели читают Markdown как контекст нативно
  • Бросить в Obsidian или Notion --- один файл, полностью поиском по тексту, с нормальной иерархией заголовков
  • Процитировать конкретный тайм-код --- вернуться к «34-й минуте» в двухчасовом докладе --- один поиск
  • Заархивировать доклад до того, как его уберут --- каналы удаляют, видео делают приватными, ваши заметки не должны зависеть от аптайма YouTube
  • Перевести видео на иностранном языке --- как только это текст, с ним работает любой переводческий инструмент

Сценарий, который генерирует большую часть трафика «YouTube в Markdown» в 2026 году, --- первый: люди хотят задавать LLM вопросы про только что просмотренное видео, а вставка URL не работает.

Метод 1: Save (самый быстрый, в один клик)

Save --- это расширение для Chrome, которое превращает любую страницу YouTube в Markdown-файл одним кликом. Оно расшифровывает аудио моделью класса Whisper, прогоняет короткий проход очистки и выдаёт текст, который реально читается как проза, а не как сырые субтитры.

Как это работает:

  1. Откройте YouTube-видео в Chrome
  2. Нажмите на иконку расширения Save в панели инструментов
  3. Файл .md мгновенно скачивается (или попадает в ваш Save Vault, если он подключён)

Что вы получаете:

  • Резюме, сгенерированное ИИ, в начале --- можно просмотреть перед чтением
  • Ключевые тезисы списком
  • Полная расшифровка с тайм-кодами каждые несколько минут
  • Заголовки глав, если в видео они есть
  • Frontmatter с заголовком, каналом, датой публикации, длительностью и URL
  • Метки спикеров, когда звучит более одного голоса

Что удаляется:

  • Боковая панель рекомендованных видео и навигационный хром YouTube
  • Рекламные паузы и спонсорские сегменты внутри расшифровки
  • Комментарии (если явно не включить)
  • Повторяющиеся артефакты из авто-субтитров

Лучше всего для: исследователей, пользователей ИИ, студентов, слушателей подкастов. Если вам нужна чистая расшифровка, которую вы вставите в Claude или прочитаете в Obsidian, --- это самый чистый путь.

Пример вывода

Сохранение часовой лекции Карпатого даёт:

---
title: "[1hr Talk] Intro to Large Language Models"
channel: Andrej Karpathy
url: https://youtube.com/watch?v=zjkBMFhNj_g
duration: 60m
date: 2024-01-15
---

## Summary

Karpathy walks through what an LLM is at the level of bytes on a hard drive,
how training works in practice, and where the discipline is heading. The
core framing: LLMs are file compressors with a thinking layer on top, the
training stack is straightforward but the data work is brutal, and prompt
engineering is becoming software engineering.

## Key Points

- An LLM at rest is two files (parameters and run.c)
- Training is next-token prediction on the internet
- Fine-tuning is what makes models useful for a task
- Scaling laws still hold, but data quality matters more now
- Tool use is the next leap

## Full Transcript

[00:00] Hi everyone, so I've been wanting to do this talk for a while.
We have a lot of really exciting topics to cover...

[02:34] So let's start with what an LLM actually is, at the level of
bytes on a hard drive...

От этого файла до пригодного контекста для Claude --- одна вставка, до постоянной заметки в Obsidian --- одно нажатие клавиши.

Метод 2: субтитры YouTube (бесплатно, грязно)

YouTube отдаёт авто-субтитры через боковую панель CC. Их можно извлечь и переформатировать вручную.

Шаги:

  1. Откройте видео, кликните по меню ..., выберите Открыть расшифровку
  2. Скопируйте строки с тайм-кодами в текстовый редактор
  3. Снимите тайм-коды, добавьте пунктуацию, поправьте смены спикеров вручную

Проблемы этого подхода:

  • В авто-субтитрах нет ни пунктуации, ни границ предложений
  • Смены спикеров вообще никак не отмечены
  • Музыка, аплодисменты и тишина появляются как артефакты [Music] / [Applause]
  • Длинные паузы и слова-паразиты («ну», «эээ», «типа») не вычищаются
  • Без 30 минут чистки результат редко годится как контекст для LLM

Подходит для трёхминутного клипа. Разваливается на чём-либо длиннее.

Метод 3: yt-dlp + Whisper локально

Для полного контроля можно запустить Whisper по аудио самостоятельно.

yt-dlp -x --audio-format mp3 "https://youtube.com/watch?v=VIDEO_ID"
whisper VIDEO_ID.mp3 --model medium --output_format txt

Лучше всего для: инженерных команд, расшифровывающих в масштабе, или для тех, кто гоняет Whisper офлайн ради приватности. Требует окружения Python, нескольких ГБ диска под модель и либо GPU, либо терпения.

Проблемы этого подхода:

  • Никакого резюме, никаких тезисов, никакой чистой структуры --- только сырой текст расшифровки
  • Диаризация спикеров требует отдельной модели (pyannote.audio или похожей)
  • Маркеры глав со страницы YouTube не восстанавливаются
  • Проход очистки (пунктуация, абзацы, удаление слов-паразитов) --- отдельный шаг

Это правильный метод, если вы строите пайплайн. Для одного видео это перебор.

Метод 4: сторонние сервисы расшифровки

Инструменты вроде Descript, Otter.ai и Sonix могут взять YouTube-URL и выдать расшифровку.

Лучше всего для: подкастеров и контент-команд, которым также нужны монтаж, идентификация спикеров и командная работа над расшифровкой.

Проблемы для сценария с Markdown:

  • Вывод обычно в проприетарном формате (проект Descript, заметки Otter), а не чистый Markdown
  • Большинство --- платные сервисы с поминутной тарификацией, которая быстро накапливается
  • Расшифровка редко структурирована в виде «резюме + тезисы + тело»
  • Сделаны под видео-монтажные пайплайны, а не для скармливания моделям ИИ

Какой метод выбрать?

СценарийЛучший метод
Вставить видео в Claude или ChatGPTSave --- один клик, структурированный вывод
Сохранить подкаст, чтобы прочитать позжеSave --- резюме делает длинный контент пробегаемым взглядом
Процитировать конкретный момент в двухчасовом докладеSave --- тайм-коды сохранены
Построить внутренний пайплайн расшифровкиyt-dlp + Whisper --- программируемо и офлайн
Расшифровать для монтажа видеоDescript или Otter --- сделаны под этот воркфлоу
Быстро получить черновую расшифровку трёхминутного клипаCC YouTube --- бесплатно, быстро, грязно

Для большинства людей --- особенно для всех, кто использует YouTube-контент как контекст для ИИ, --- Save и есть ответ. Он выдаёт самый чистый Markdown без всякой настройки и справляется с длинным видео с той же скоростью, что и с твитом.

Граничные случаи, которые Save обрабатывает

  • Длинные видео (от 2 до 4 часов). Save разбивает аудио на куски и сшивает расшифровку с непрерывными тайм-кодами. Резюме сверху --- ключевая деталь. Без него никто не будет читать 30 000 слов.
  • Несколько спикеров. Whisper делает базовую диаризацию. Save добавляет метки спикеров, когда голос не один. Не всегда идеально на интервью с быстрой перепалкой, но обычно правильно на подкастах и панелях конференций.
  • Многоязычные видео. Если аудио на французском, расшифровка остаётся на французском. Никакого принудительного перевода. Хотите по-английски --- попросите Claude перевести потом.
  • Авто-субтитры отключены. Не важно. Save расшифровывает аудио напрямую, не зависит от CC-дорожки YouTube.
  • Shorts. Тот же пайплайн, просто быстрее. Вывод короче, но всё равно с frontmatter из метаданных и резюме.
  • Ограниченные или только для подписчиков канала видео. Save видит то же, что видит ваш залогиненный браузер. Если вы можете смотреть, Save может расшифровать.
  • Прямые эфиры (после окончания). Работает на архивном VOD, как только YouTube завершит его обработку. Идущие прямо сейчас эфиры не поддерживаются.

Соедините с вашим воркфлоу

Markdown-вывод работает везде, где он вам нужен:

  • Claude / ChatGPT / Gemini --- вставьте файл, задавайте уточняющие вопросы по видео
  • Obsidian --- бросьте в свой vault, свяжите с другими заметками, ищите по всем сохранённым докладам
  • Notion --- вставьте напрямую, заголовки и кодовые блоки отрендерятся корректно
  • Apple Notes --- чистый импорт через Markdown share extension
  • Save Vault --- если у вас подключено, каждое YouTube-сохранение автоматически попадает туда с обратными ссылками и тегами

FAQ

Работает ли Save на мобильной версии сайта YouTube или в приложении? Расширение пока только под десктопный Chrome. На мобильном --- скопируйте URL и откройте на десктопе, или вставьте в Save Vault на Mac (у него есть URL-обработчик).

А что насчёт YouTube Music или плейлистов? Только отдельные видео. Плейлисты не обходятся как один документ. Музыкальные клипы работают, но расшифровка --- это только текст песни, если он есть.

Можно получить только резюме без полной расшифровки? Да. Расширение даёт выбрать: только расшифровку, только резюме или и то, и другое. По умолчанию --- оба, потому что на большинстве видео оба коротки.

Сохраняются ли главы? Если у видео есть маркеры глав, Save использует их как заголовки разделов в расшифровке. По длинным видео становится сильно проще навигировать.

Включает ли расшифровка слова-паразиты? Проход очистки убирает большую часть «ну», «эээ» и фальстартов. Голос и тон спикера сохраняются --- удаляется только речевой шум, из-за которого сырые расшифровки тяжело читать.

Достаточно ли точна расшифровка, чтобы цитировать? Для речи в нормальном темпе --- да. Для очень технического контента с редкими собственными именами сверьте написание с видео. Save использует модель класса Whisper, которая является state of the art в английском и очень хороша на большинстве крупных языков.

Сколько это стоит? У Save есть бесплатный тариф, чтобы попробовать на нескольких видео. Дальше --- небольшая подписка, покрывающая расходы на расшифровку.

Связанные гиды Save

## Continue reading

Jean-Sébastien Wallez

Written by

Jean-Sébastien Wallez

I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.

## try save

Готовы сохранять умнее?

Конвертируйте любую веб-страницу в Markdown одним кликом.

Добавить в Chrome 🐿️