Как сохранить видео с YouTube в Markdown (расшифровка, резюме, тайм-коды)
YouTube не хочет, чтобы вы уходили с контентом. Нет кнопки экспорта, нет загрузки расшифровки, нет опции «скопировать в заметки». Боковая панель с субтитрами выдаёт сырые блоки субтитров без пунктуации. Если вы когда-нибудь пытались бросить YouTube-видео в Claude или ChatGPT в качестве контекста, вы знаете проблему --- вставка URL не даёт модели ничего, потому что модель не может смотреть.
Этот гид охватывает все методы конвертации YouTube-видео в чистый Markdown --- от одного доклада до многочасового подкаста.
Зачем сохранять видео с YouTube в Markdown?
Markdown --- это формат, который работает везде, куда нужно поместить расшифровку:
- Скормить LLM --- Claude, ChatGPT, Gemini и локальные модели читают Markdown как контекст нативно
- Бросить в Obsidian или Notion --- один файл, полностью поиском по тексту, с нормальной иерархией заголовков
- Процитировать конкретный тайм-код --- вернуться к «34-й минуте» в двухчасовом докладе --- один поиск
- Заархивировать доклад до того, как его уберут --- каналы удаляют, видео делают приватными, ваши заметки не должны зависеть от аптайма YouTube
- Перевести видео на иностранном языке --- как только это текст, с ним работает любой переводческий инструмент
Сценарий, который генерирует большую часть трафика «YouTube в Markdown» в 2026 году, --- первый: люди хотят задавать LLM вопросы про только что просмотренное видео, а вставка URL не работает.
Метод 1: Save (самый быстрый, в один клик)
Save --- это расширение для Chrome, которое превращает любую страницу YouTube в Markdown-файл одним кликом. Оно расшифровывает аудио моделью класса Whisper, прогоняет короткий проход очистки и выдаёт текст, который реально читается как проза, а не как сырые субтитры.
Как это работает:
- Откройте YouTube-видео в Chrome
- Нажмите на иконку расширения Save в панели инструментов
- Файл
.mdмгновенно скачивается (или попадает в ваш Save Vault, если он подключён)
Что вы получаете:
- Резюме, сгенерированное ИИ, в начале --- можно просмотреть перед чтением
- Ключевые тезисы списком
- Полная расшифровка с тайм-кодами каждые несколько минут
- Заголовки глав, если в видео они есть
- Frontmatter с заголовком, каналом, датой публикации, длительностью и URL
- Метки спикеров, когда звучит более одного голоса
Что удаляется:
- Боковая панель рекомендованных видео и навигационный хром YouTube
- Рекламные паузы и спонсорские сегменты внутри расшифровки
- Комментарии (если явно не включить)
- Повторяющиеся артефакты из авто-субтитров
Лучше всего для: исследователей, пользователей ИИ, студентов, слушателей подкастов. Если вам нужна чистая расшифровка, которую вы вставите в Claude или прочитаете в Obsidian, --- это самый чистый путь.
Пример вывода
Сохранение часовой лекции Карпатого даёт:
---
title: "[1hr Talk] Intro to Large Language Models"
channel: Andrej Karpathy
url: https://youtube.com/watch?v=zjkBMFhNj_g
duration: 60m
date: 2024-01-15
---
## Summary
Karpathy walks through what an LLM is at the level of bytes on a hard drive,
how training works in practice, and where the discipline is heading. The
core framing: LLMs are file compressors with a thinking layer on top, the
training stack is straightforward but the data work is brutal, and prompt
engineering is becoming software engineering.
## Key Points
- An LLM at rest is two files (parameters and run.c)
- Training is next-token prediction on the internet
- Fine-tuning is what makes models useful for a task
- Scaling laws still hold, but data quality matters more now
- Tool use is the next leap
## Full Transcript
[00:00] Hi everyone, so I've been wanting to do this talk for a while.
We have a lot of really exciting topics to cover...
[02:34] So let's start with what an LLM actually is, at the level of
bytes on a hard drive...
От этого файла до пригодного контекста для Claude --- одна вставка, до постоянной заметки в Obsidian --- одно нажатие клавиши.
Метод 2: субтитры YouTube (бесплатно, грязно)
YouTube отдаёт авто-субтитры через боковую панель CC. Их можно извлечь и переформатировать вручную.
Шаги:
- Откройте видео, кликните по меню
..., выберите Открыть расшифровку - Скопируйте строки с тайм-кодами в текстовый редактор
- Снимите тайм-коды, добавьте пунктуацию, поправьте смены спикеров вручную
Проблемы этого подхода:
- В авто-субтитрах нет ни пунктуации, ни границ предложений
- Смены спикеров вообще никак не отмечены
- Музыка, аплодисменты и тишина появляются как артефакты
[Music]/[Applause] - Длинные паузы и слова-паразиты («ну», «эээ», «типа») не вычищаются
- Без 30 минут чистки результат редко годится как контекст для LLM
Подходит для трёхминутного клипа. Разваливается на чём-либо длиннее.
Метод 3: yt-dlp + Whisper локально
Для полного контроля можно запустить Whisper по аудио самостоятельно.
yt-dlp -x --audio-format mp3 "https://youtube.com/watch?v=VIDEO_ID"
whisper VIDEO_ID.mp3 --model medium --output_format txt
Лучше всего для: инженерных команд, расшифровывающих в масштабе, или для тех, кто гоняет Whisper офлайн ради приватности. Требует окружения Python, нескольких ГБ диска под модель и либо GPU, либо терпения.
Проблемы этого подхода:
- Никакого резюме, никаких тезисов, никакой чистой структуры --- только сырой текст расшифровки
- Диаризация спикеров требует отдельной модели (
pyannote.audioили похожей) - Маркеры глав со страницы YouTube не восстанавливаются
- Проход очистки (пунктуация, абзацы, удаление слов-паразитов) --- отдельный шаг
Это правильный метод, если вы строите пайплайн. Для одного видео это перебор.
Метод 4: сторонние сервисы расшифровки
Инструменты вроде Descript, Otter.ai и Sonix могут взять YouTube-URL и выдать расшифровку.
Лучше всего для: подкастеров и контент-команд, которым также нужны монтаж, идентификация спикеров и командная работа над расшифровкой.
Проблемы для сценария с Markdown:
- Вывод обычно в проприетарном формате (проект Descript, заметки Otter), а не чистый Markdown
- Большинство --- платные сервисы с поминутной тарификацией, которая быстро накапливается
- Расшифровка редко структурирована в виде «резюме + тезисы + тело»
- Сделаны под видео-монтажные пайплайны, а не для скармливания моделям ИИ
Какой метод выбрать?
| Сценарий | Лучший метод |
|---|---|
| Вставить видео в Claude или ChatGPT | Save --- один клик, структурированный вывод |
| Сохранить подкаст, чтобы прочитать позже | Save --- резюме делает длинный контент пробегаемым взглядом |
| Процитировать конкретный момент в двухчасовом докладе | Save --- тайм-коды сохранены |
| Построить внутренний пайплайн расшифровки | yt-dlp + Whisper --- программируемо и офлайн |
| Расшифровать для монтажа видео | Descript или Otter --- сделаны под этот воркфлоу |
| Быстро получить черновую расшифровку трёхминутного клипа | CC YouTube --- бесплатно, быстро, грязно |
Для большинства людей --- особенно для всех, кто использует YouTube-контент как контекст для ИИ, --- Save и есть ответ. Он выдаёт самый чистый Markdown без всякой настройки и справляется с длинным видео с той же скоростью, что и с твитом.
Граничные случаи, которые Save обрабатывает
- Длинные видео (от 2 до 4 часов). Save разбивает аудио на куски и сшивает расшифровку с непрерывными тайм-кодами. Резюме сверху --- ключевая деталь. Без него никто не будет читать 30 000 слов.
- Несколько спикеров. Whisper делает базовую диаризацию. Save добавляет метки спикеров, когда голос не один. Не всегда идеально на интервью с быстрой перепалкой, но обычно правильно на подкастах и панелях конференций.
- Многоязычные видео. Если аудио на французском, расшифровка остаётся на французском. Никакого принудительного перевода. Хотите по-английски --- попросите Claude перевести потом.
- Авто-субтитры отключены. Не важно. Save расшифровывает аудио напрямую, не зависит от CC-дорожки YouTube.
- Shorts. Тот же пайплайн, просто быстрее. Вывод короче, но всё равно с frontmatter из метаданных и резюме.
- Ограниченные или только для подписчиков канала видео. Save видит то же, что видит ваш залогиненный браузер. Если вы можете смотреть, Save может расшифровать.
- Прямые эфиры (после окончания). Работает на архивном VOD, как только YouTube завершит его обработку. Идущие прямо сейчас эфиры не поддерживаются.
Соедините с вашим воркфлоу
Markdown-вывод работает везде, где он вам нужен:
- Claude / ChatGPT / Gemini --- вставьте файл, задавайте уточняющие вопросы по видео
- Obsidian --- бросьте в свой vault, свяжите с другими заметками, ищите по всем сохранённым докладам
- Notion --- вставьте напрямую, заголовки и кодовые блоки отрендерятся корректно
- Apple Notes --- чистый импорт через Markdown share extension
- Save Vault --- если у вас подключено, каждое YouTube-сохранение автоматически попадает туда с обратными ссылками и тегами
FAQ
Работает ли Save на мобильной версии сайта YouTube или в приложении? Расширение пока только под десктопный Chrome. На мобильном --- скопируйте URL и откройте на десктопе, или вставьте в Save Vault на Mac (у него есть URL-обработчик).
А что насчёт YouTube Music или плейлистов? Только отдельные видео. Плейлисты не обходятся как один документ. Музыкальные клипы работают, но расшифровка --- это только текст песни, если он есть.
Можно получить только резюме без полной расшифровки? Да. Расширение даёт выбрать: только расшифровку, только резюме или и то, и другое. По умолчанию --- оба, потому что на большинстве видео оба коротки.
Сохраняются ли главы? Если у видео есть маркеры глав, Save использует их как заголовки разделов в расшифровке. По длинным видео становится сильно проще навигировать.
Включает ли расшифровка слова-паразиты? Проход очистки убирает большую часть «ну», «эээ» и фальстартов. Голос и тон спикера сохраняются --- удаляется только речевой шум, из-за которого сырые расшифровки тяжело читать.
Достаточно ли точна расшифровка, чтобы цитировать? Для речи в нормальном темпе --- да. Для очень технического контента с редкими собственными именами сверьте написание с видео. Save использует модель класса Whisper, которая является state of the art в английском и очень хороша на большинстве крупных языков.
Сколько это стоит? У Save есть бесплатный тариф, чтобы попробовать на нескольких видео. Дальше --- небольшая подписка, покрывающая расходы на расшифровку.
Связанные гиды Save
- Сохранение тредов Reddit в Markdown --- треды с сохранённой вложенностью комментариев
- Сохранение диалогов с ChatGPT в Markdown --- каждая реплика, с целыми кодовыми блоками
- Сохранение репозиториев и issue с GitHub в Markdown --- README, issue, обсуждения PR --- всё в одном файле
- Сохранение страниц Notion в Markdown --- toggle развёрнуты, базы данных --- таблицами
- Сохранение тредов Twitter / X в Markdown --- каждый твит, по порядку, с авторством
## Continue reading
Как сохранить диалог с Claude в Markdown (Artifacts, цитаты, Projects)
Конвертируйте диалоги с Claude в чистый Markdown: каждый шаг, Artifacts как блоки кода, цитаты сохранены. Полное руководство для исследователей и пользователей ИИ.
Как сохранить тред Twitter / X в Markdown (полный тред, по порядку)
Конвертируйте любой тред Twitter или X в чистый Markdown: каждый твит в порядке публикации, с авторством, временными метками и вложенными цитируемыми твитами. Гид 2026.
Как сохранять репозитории, Issues и PR GitHub в формате Markdown (Руководство 2026)
Конвертируйте любой README, issue, PR, discussion или gist GitHub в чистый Markdown. Полное руководство 2026 для разработчиков, исследователей и пользователей ИИ.
Как конвертировать статьи arXiv в Markdown для AI-исследований
Конвертируйте статьи arXiv в чистый Markdown для использования с Claude, ChatGPT или Obsidian. Создайте поисковую исследовательскую библиотеку из академических статей без ручного форматирования.
Written by
Jean-Sébastien Wallez
I've been making internet products for 10+ years. Built Save on weekends because I wanted my own reading library in clean markdown for Claude and Obsidian. Write here about web clipping, AI workflows, and the small things that make a personal knowledge base actually useful.