Как сохранить видео с YouTube в Markdown (расшифровка, резюме, тайм-коды)

YouTube не хочет, чтобы вы уходили с контентом. Нет кнопки экспорта, нет загрузки расшифровки, нет опции «скопировать в заметки». Боковая панель с субтитрами выдаёт сырые блоки субтитров без пунктуации. Если вы когда-нибудь пытались бросить YouTube-видео в Claude или ChatGPT в качестве контекста, вы знаете проблему --- вставка URL не даёт модели ничего, потому что модель не может смотреть.

Этот гид охватывает все методы конвертации YouTube-видео в чистый Markdown --- от одного доклада до многочасового подкаста.

Зачем сохранять видео с YouTube в Markdown?

Markdown --- это формат, который работает везде, куда нужно поместить расшифровку:

Скормить LLM --- Claude, ChatGPT, Gemini и локальные модели читают Markdown как контекст нативно
Бросить в Obsidian или Notion --- один файл, полностью поиском по тексту, с нормальной иерархией заголовков
Процитировать конкретный тайм-код --- вернуться к «34-й минуте» в двухчасовом докладе --- один поиск
Заархивировать доклад до того, как его уберут --- каналы удаляют, видео делают приватными, ваши заметки не должны зависеть от аптайма YouTube
Перевести видео на иностранном языке --- как только это текст, с ним работает любой переводческий инструмент

Сценарий, который генерирует большую часть трафика «YouTube в Markdown» в 2026 году, --- первый: люди хотят задавать LLM вопросы про только что просмотренное видео, а вставка URL не работает.

Метод 1: Save (самый быстрый, в один клик)

Save --- это расширение для Chrome, которое превращает любую страницу YouTube в Markdown-файл одним кликом. Оно расшифровывает аудио моделью класса Whisper, прогоняет короткий проход очистки и выдаёт текст, который реально читается как проза, а не как сырые субтитры.

Как это работает:

Откройте YouTube-видео в Chrome
Нажмите на иконку расширения Save в панели инструментов
Файл .md мгновенно скачивается (или попадает в ваш Save Vault, если он подключён)

Что вы получаете:

Резюме, сгенерированное ИИ, в начале --- можно просмотреть перед чтением
Ключевые тезисы списком
Полная расшифровка с тайм-кодами каждые несколько минут
Заголовки глав, если в видео они есть
Frontmatter с заголовком, каналом, датой публикации, длительностью и URL
Метки спикеров, когда звучит более одного голоса

Что удаляется:

Боковая панель рекомендованных видео и навигационный хром YouTube
Рекламные паузы и спонсорские сегменты внутри расшифровки
Комментарии (если явно не включить)
Повторяющиеся артефакты из авто-субтитров

Лучше всего для: исследователей, пользователей ИИ, студентов, слушателей подкастов. Если вам нужна чистая расшифровка, которую вы вставите в Claude или прочитаете в Obsidian, --- это самый чистый путь.

Пример вывода

Сохранение часовой лекции Карпатого даёт:

---
title: "[1hr Talk] Intro to Large Language Models"
channel: Andrej Karpathy
url: https://youtube.com/watch?v=zjkBMFhNj_g
duration: 60m
date: 2024-01-15
---

## Summary

Karpathy walks through what an LLM is at the level of bytes on a hard drive,
how training works in practice, and where the discipline is heading. The
core framing: LLMs are file compressors with a thinking layer on top, the
training stack is straightforward but the data work is brutal, and prompt
engineering is becoming software engineering.

## Key Points

- An LLM at rest is two files (parameters and run.c)
- Training is next-token prediction on the internet
- Fine-tuning is what makes models useful for a task
- Scaling laws still hold, but data quality matters more now
- Tool use is the next leap

## Full Transcript

[00:00] Hi everyone, so I've been wanting to do this talk for a while.
We have a lot of really exciting topics to cover...

[02:34] So let's start with what an LLM actually is, at the level of
bytes on a hard drive...

От этого файла до пригодного контекста для Claude --- одна вставка, до постоянной заметки в Obsidian --- одно нажатие клавиши.

Метод 2: субтитры YouTube (бесплатно, грязно)

YouTube отдаёт авто-субтитры через боковую панель CC. Их можно извлечь и переформатировать вручную.

Шаги:

Откройте видео, кликните по меню ..., выберите Открыть расшифровку
Скопируйте строки с тайм-кодами в текстовый редактор
Снимите тайм-коды, добавьте пунктуацию, поправьте смены спикеров вручную

Проблемы этого подхода:

В авто-субтитрах нет ни пунктуации, ни границ предложений
Смены спикеров вообще никак не отмечены
Музыка, аплодисменты и тишина появляются как артефакты [Music] / [Applause]
Длинные паузы и слова-паразиты («ну», «эээ», «типа») не вычищаются
Без 30 минут чистки результат редко годится как контекст для LLM

Подходит для трёхминутного клипа. Разваливается на чём-либо длиннее.

Метод 3: yt-dlp + Whisper локально

Для полного контроля можно запустить Whisper по аудио самостоятельно.

yt-dlp -x --audio-format mp3 "https://youtube.com/watch?v=VIDEO_ID"
whisper VIDEO_ID.mp3 --model medium --output_format txt

Лучше всего для: инженерных команд, расшифровывающих в масштабе, или для тех, кто гоняет Whisper офлайн ради приватности. Требует окружения Python, нескольких ГБ диска под модель и либо GPU, либо терпения.

Проблемы этого подхода:

Никакого резюме, никаких тезисов, никакой чистой структуры --- только сырой текст расшифровки
Диаризация спикеров требует отдельной модели (pyannote.audio или похожей)
Маркеры глав со страницы YouTube не восстанавливаются
Проход очистки (пунктуация, абзацы, удаление слов-паразитов) --- отдельный шаг

Это правильный метод, если вы строите пайплайн. Для одного видео это перебор.

Метод 4: сторонние сервисы расшифровки

Инструменты вроде Descript, Otter.ai и Sonix могут взять YouTube-URL и выдать расшифровку.

Лучше всего для: подкастеров и контент-команд, которым также нужны монтаж, идентификация спикеров и командная работа над расшифровкой.

Проблемы для сценария с Markdown:

Вывод обычно в проприетарном формате (проект Descript, заметки Otter), а не чистый Markdown
Большинство --- платные сервисы с поминутной тарификацией, которая быстро накапливается
Расшифровка редко структурирована в виде «резюме + тезисы + тело»
Сделаны под видео-монтажные пайплайны, а не для скармливания моделям ИИ

Какой метод выбрать?

Сценарий	Лучший метод
Вставить видео в Claude или ChatGPT	Save --- один клик, структурированный вывод
Сохранить подкаст, чтобы прочитать позже	Save --- резюме делает длинный контент пробегаемым взглядом
Процитировать конкретный момент в двухчасовом докладе	Save --- тайм-коды сохранены
Построить внутренний пайплайн расшифровки	yt-dlp + Whisper --- программируемо и офлайн
Расшифровать для монтажа видео	Descript или Otter --- сделаны под этот воркфлоу
Быстро получить черновую расшифровку трёхминутного клипа	CC YouTube --- бесплатно, быстро, грязно

Для большинства людей --- особенно для всех, кто использует YouTube-контент как контекст для ИИ, --- Save и есть ответ. Он выдаёт самый чистый Markdown без всякой настройки и справляется с длинным видео с той же скоростью, что и с твитом.

Граничные случаи, которые Save обрабатывает

Длинные видео (от 2 до 4 часов). Save разбивает аудио на куски и сшивает расшифровку с непрерывными тайм-кодами. Резюме сверху --- ключевая деталь. Без него никто не будет читать 30 000 слов.
Несколько спикеров. Whisper делает базовую диаризацию. Save добавляет метки спикеров, когда голос не один. Не всегда идеально на интервью с быстрой перепалкой, но обычно правильно на подкастах и панелях конференций.
Многоязычные видео. Если аудио на французском, расшифровка остаётся на французском. Никакого принудительного перевода. Хотите по-английски --- попросите Claude перевести потом.
Авто-субтитры отключены. Не важно. Save расшифровывает аудио напрямую, не зависит от CC-дорожки YouTube.
Shorts. Тот же пайплайн, просто быстрее. Вывод короче, но всё равно с frontmatter из метаданных и резюме.
Ограниченные или только для подписчиков канала видео. Save видит то же, что видит ваш залогиненный браузер. Если вы можете смотреть, Save может расшифровать.
Прямые эфиры (после окончания). Работает на архивном VOD, как только YouTube завершит его обработку. Идущие прямо сейчас эфиры не поддерживаются.

Соедините с вашим воркфлоу

Markdown-вывод работает везде, где он вам нужен:

Claude / ChatGPT / Gemini --- вставьте файл, задавайте уточняющие вопросы по видео
Obsidian --- бросьте в свой vault, свяжите с другими заметками, ищите по всем сохранённым докладам
Notion --- вставьте напрямую, заголовки и кодовые блоки отрендерятся корректно
Apple Notes --- чистый импорт через Markdown share extension
Save Vault --- если у вас подключено, каждое YouTube-сохранение автоматически попадает туда с обратными ссылками и тегами

FAQ

Работает ли Save на мобильной версии сайта YouTube или в приложении? Расширение пока только под десктопный Chrome. На мобильном --- скопируйте URL и откройте на десктопе, или вставьте в Save Vault на Mac (у него есть URL-обработчик).

А что насчёт YouTube Music или плейлистов? Только отдельные видео. Плейлисты не обходятся как один документ. Музыкальные клипы работают, но расшифровка --- это только текст песни, если он есть.

Можно получить только резюме без полной расшифровки? Да. Расширение даёт выбрать: только расшифровку, только резюме или и то, и другое. По умолчанию --- оба, потому что на большинстве видео оба коротки.

Сохраняются ли главы? Если у видео есть маркеры глав, Save использует их как заголовки разделов в расшифровке. По длинным видео становится сильно проще навигировать.

Включает ли расшифровка слова-паразиты? Проход очистки убирает большую часть «ну», «эээ» и фальстартов. Голос и тон спикера сохраняются --- удаляется только речевой шум, из-за которого сырые расшифровки тяжело читать.

Достаточно ли точна расшифровка, чтобы цитировать? Для речи в нормальном темпе --- да. Для очень технического контента с редкими собственными именами сверьте написание с видео. Save использует модель класса Whisper, которая является state of the art в английском и очень хороша на большинстве крупных языков.

Сколько это стоит? У Save есть бесплатный тариф, чтобы попробовать на нескольких видео. Дальше --- небольшая подписка, покрывающая расходы на расшифровку.

Связанные гиды Save

Сохранение тредов Reddit в Markdown --- треды с сохранённой вложенностью комментариев
Сохранение диалогов с ChatGPT в Markdown --- каждая реплика, с целыми кодовыми блоками
Сохранение репозиториев и issue с GitHub в Markdown --- README, issue, обсуждения PR --- всё в одном файле
Сохранение страниц Notion в Markdown --- toggle развёрнуты, базы данных --- таблицами
Сохранение тредов Twitter / X в Markdown --- каждый твит, по порядку, с авторством

Как сохранить видео с YouTube в Markdown (расшифровка, резюме, тайм-коды)

Зачем сохранять видео с YouTube в Markdown?

Метод 1: Save (самый быстрый, в один клик)

Пример вывода

Метод 2: субтитры YouTube (бесплатно, грязно)

Метод 3: yt-dlp + Whisper локально

Метод 4: сторонние сервисы расшифровки

Какой метод выбрать?

Граничные случаи, которые Save обрабатывает

Соедините с вашим воркфлоу

FAQ

Связанные гиды Save

## Continue reading

Как сохранить диалог с Claude в Markdown (Artifacts, цитаты, Projects)

Как сохранить тред Twitter / X в Markdown (полный тред, по порядку)

Как сохранять репозитории, Issues и PR GitHub в формате Markdown (Руководство 2026)

Как конвертировать статьи arXiv в Markdown для AI-исследований

Jean-Sébastien Wallez