19% Улучшение Shopify: Как Компании Уже Применяют Паттерн Автоисследований
Когда Карпати выпустил автоисследования 7 марта 2026 года, прошли ровно дни — не недели, не месяцы — прежде чем компании начали применять их к собственным задачам.
Самый заметный ранний последователь: CEO Shopify Тоби Лютке, который адаптировал фреймворк автоисследований для внутреннего проекта. Результат? Модель с 0,8 миллиарда параметров, обученная за ночь, превзошла предыдущую модель с 1,6 миллиарда параметров на 19% всего за 37 экспериментов за 8 часов.
Меньшая модель. Лучшие результаты. Нулевое человеческое вмешательство в ночное время.
Паттерн Автоисследований в Бизнесе
То, что продемонстрировал Shopify — это не просто занятный ML-эксперимент. Это доказательство концепции нового способа ведения R&D компаниями.
Традиционный подход: нанять ML-инженеров, поручить им ручное проведение экспериментов, рассматривать результаты на совещаниях, принимать решения о следующих шагах, медленно повторять. Хорошая команда может провести 30 целенаправленных экспериментов в месяц.
Подход автоисследований: написать program.md с описанием целей, позволить агенту ИИ проводить эксперименты ночью, утром просмотреть результаты. Один инженер, один GPU, 100+ экспериментов за ночь.
Математика подавляющая. Ручные исследования производят ~1 эксперимент в день на исследователя. Автоисследования производят ~12 в час. Это 100-кратное увеличение пропускной способности экспериментов.
За пределами ML: 36 500 Экспериментов в Год
Паттерн выходит за рамки обучения моделей. Маркетинговые команды обычно проводят около 30 экспериментов в год — A/B-тесты, варианты текста, изменения таргетинга аудитории. Это медленно, потому что каждый эксперимент требует человеческой настройки, мониторинга и анализа.
Ранние последователи уже представляют мир, где автономные агенты проводят 100 маркетинговых экспериментов в день, измеряют коэффициенты конверсии, корректируют текст и итерируют таргетинг — всё под руководством program.md, определяющего цели и ограничения бренда.
Это 36 500+ экспериментов в год против 30. Компании, первыми освоившие этот паттерн, получат накапливающееся преимущество, наверстать которое практически невозможно.
Что Сделало Результаты Shopify Возможными
Улучшение на 19% у Shopify было не случайным. Несколько факторов обеспечили этот результат:
Чёткие метрики. У них была хорошо определённая метрика оценки, которую агент мог автоматически измерять после каждого эксперимента. Без автоматизированного измерения цикл разрушается.
Ограниченная область. Как и в случае с 630-строчным train.py Карпати, Shopify сохранил изменяемую кодовую базу достаточно маленькой, чтобы LLM мог полностью её понять. Не нужно бросать на агента кодовую базу из миллиона строк и надеяться на лучшее.
Хорошие начальные инструкции. program.md, направлявший агента, был создан на основе доменных знаний команды. Агент искал не случайным образом — он исследовал направления, которые команда определила как перспективные.
Доверие к процессу. Они позволили ему работать ночью без вмешательства. Желание проверять и корректировать каждый час лишает смысла автономное экспериментирование.
Паттерн Ночного Запуска
Типичное внедрение автоисследований следует паттерну:
День 1: Настройте окружение, напишите первый program.md, вручную запустите несколько экспериментов для проверки работы цикла.
Ночь 1: Запустите агента перед уходом. Настройте его на бесконечную работу, фиксацию улучшений и откат неудач.
Утро дня 2: Просмотрите журнал git. Посмотрите, что пробовал агент, что сработало, а что нет. Обновите program.md на основе усвоенного.
Ночь 2: Запустите снова с улучшенными инструкциями. Агент начинает с лучшего результата Ночи 1.
За неделю: У вас есть отточенный program.md и десятки проверенных улучшений, на открытие которых человеческой команде потребовались бы месяцы.
Отрасли, Готовые к Этому Паттерну
Любая область, предполагающая систематические эксперименты, может освоить цикл автоисследований:
Машинное обучение — исходный случай использования. Настройка гиперпараметров, поиск архитектуры, эксперименты с регуляризацией.
Оптимизация программного обеспечения — настройка производительности, уменьшение размера бандла, оптимизация запросов. Везде, где есть измеримая метрика и изменяемый код.
Разработка лекарств — молекулярные симуляции с измеримым сродством связывания. Эксперимент вычислительный, метрика числовая, цикл автоматизируем.
Финансовое моделирование — бэктестинг торговых стратегий на исторических данных. Чёткие метрики, быстрая обратная связь, огромное пространство поиска.
Оптимизация контента — A/B-тестирование заголовков, макетов и текста с коэффициентом конверсии в качестве метрики.
Преимущество Markdown
В каждом случае вклад человека одинаков: файл Markdown, определяющий что оптимизировать, какие ограничения соблюдать и какие стратегии пробовать.
Вот почему грамотность в Markdown становится конкурентным преимуществом. Компании, пишущие лучшие файлы program.md, получают лучшие результаты от автономных агентов. А написание хороших файлов program.md требует глубоких доменных знаний, организованных в формате, понятном ИИ.
Компании, создающие справочные библиотеки — сохраняющие документацию, конкурентный анализ, исследовательские статьи и лучшие практики в виде чистого Markdown — имеют преимущество. Когда приходит время писать program.md для ночного эксперимента, они могут черпать из кураторской базы знаний, а не начинать с нуля.
Save конвертирует любую веб-страницу в чистый Markdown — создавая библиотеку знаний, необходимую компаниям для написания эффективных инструкций для агентов ИИ. Попробуйте Save бесплатно.