← Назад к блогу

19% Улучшение Shopify: Как Компании Уже Применяют Паттерн Автоисследований

· Save Team
aiautoresearchshopifykarpathybusinessmachine-learningreal-world

Когда Карпати выпустил автоисследования 7 марта 2026 года, прошли ровно дни — не недели, не месяцы — прежде чем компании начали применять их к собственным задачам.

Самый заметный ранний последователь: CEO Shopify Тоби Лютке, который адаптировал фреймворк автоисследований для внутреннего проекта. Результат? Модель с 0,8 миллиарда параметров, обученная за ночь, превзошла предыдущую модель с 1,6 миллиарда параметров на 19% всего за 37 экспериментов за 8 часов.

Меньшая модель. Лучшие результаты. Нулевое человеческое вмешательство в ночное время.

Паттерн Автоисследований в Бизнесе

То, что продемонстрировал Shopify — это не просто занятный ML-эксперимент. Это доказательство концепции нового способа ведения R&D компаниями.

Традиционный подход: нанять ML-инженеров, поручить им ручное проведение экспериментов, рассматривать результаты на совещаниях, принимать решения о следующих шагах, медленно повторять. Хорошая команда может провести 30 целенаправленных экспериментов в месяц.

Подход автоисследований: написать program.md с описанием целей, позволить агенту ИИ проводить эксперименты ночью, утром просмотреть результаты. Один инженер, один GPU, 100+ экспериментов за ночь.

Математика подавляющая. Ручные исследования производят ~1 эксперимент в день на исследователя. Автоисследования производят ~12 в час. Это 100-кратное увеличение пропускной способности экспериментов.

За пределами ML: 36 500 Экспериментов в Год

Паттерн выходит за рамки обучения моделей. Маркетинговые команды обычно проводят около 30 экспериментов в год — A/B-тесты, варианты текста, изменения таргетинга аудитории. Это медленно, потому что каждый эксперимент требует человеческой настройки, мониторинга и анализа.

Ранние последователи уже представляют мир, где автономные агенты проводят 100 маркетинговых экспериментов в день, измеряют коэффициенты конверсии, корректируют текст и итерируют таргетинг — всё под руководством program.md, определяющего цели и ограничения бренда.

Это 36 500+ экспериментов в год против 30. Компании, первыми освоившие этот паттерн, получат накапливающееся преимущество, наверстать которое практически невозможно.

Что Сделало Результаты Shopify Возможными

Улучшение на 19% у Shopify было не случайным. Несколько факторов обеспечили этот результат:

Чёткие метрики. У них была хорошо определённая метрика оценки, которую агент мог автоматически измерять после каждого эксперимента. Без автоматизированного измерения цикл разрушается.

Ограниченная область. Как и в случае с 630-строчным train.py Карпати, Shopify сохранил изменяемую кодовую базу достаточно маленькой, чтобы LLM мог полностью её понять. Не нужно бросать на агента кодовую базу из миллиона строк и надеяться на лучшее.

Хорошие начальные инструкции. program.md, направлявший агента, был создан на основе доменных знаний команды. Агент искал не случайным образом — он исследовал направления, которые команда определила как перспективные.

Доверие к процессу. Они позволили ему работать ночью без вмешательства. Желание проверять и корректировать каждый час лишает смысла автономное экспериментирование.

Паттерн Ночного Запуска

Типичное внедрение автоисследований следует паттерну:

День 1: Настройте окружение, напишите первый program.md, вручную запустите несколько экспериментов для проверки работы цикла.

Ночь 1: Запустите агента перед уходом. Настройте его на бесконечную работу, фиксацию улучшений и откат неудач.

Утро дня 2: Просмотрите журнал git. Посмотрите, что пробовал агент, что сработало, а что нет. Обновите program.md на основе усвоенного.

Ночь 2: Запустите снова с улучшенными инструкциями. Агент начинает с лучшего результата Ночи 1.

За неделю: У вас есть отточенный program.md и десятки проверенных улучшений, на открытие которых человеческой команде потребовались бы месяцы.

Отрасли, Готовые к Этому Паттерну

Любая область, предполагающая систематические эксперименты, может освоить цикл автоисследований:

Машинное обучение — исходный случай использования. Настройка гиперпараметров, поиск архитектуры, эксперименты с регуляризацией.

Оптимизация программного обеспечения — настройка производительности, уменьшение размера бандла, оптимизация запросов. Везде, где есть измеримая метрика и изменяемый код.

Разработка лекарств — молекулярные симуляции с измеримым сродством связывания. Эксперимент вычислительный, метрика числовая, цикл автоматизируем.

Финансовое моделирование — бэктестинг торговых стратегий на исторических данных. Чёткие метрики, быстрая обратная связь, огромное пространство поиска.

Оптимизация контента — A/B-тестирование заголовков, макетов и текста с коэффициентом конверсии в качестве метрики.

Преимущество Markdown

В каждом случае вклад человека одинаков: файл Markdown, определяющий что оптимизировать, какие ограничения соблюдать и какие стратегии пробовать.

Вот почему грамотность в Markdown становится конкурентным преимуществом. Компании, пишущие лучшие файлы program.md, получают лучшие результаты от автономных агентов. А написание хороших файлов program.md требует глубоких доменных знаний, организованных в формате, понятном ИИ.

Компании, создающие справочные библиотеки — сохраняющие документацию, конкурентный анализ, исследовательские статьи и лучшие практики в виде чистого Markdown — имеют преимущество. Когда приходит время писать program.md для ночного эксперимента, они могут черпать из кураторской базы знаний, а не начинать с нуля.


Save конвертирует любую веб-страницу в чистый Markdown — создавая библиотеку знаний, необходимую компаниям для написания эффективных инструкций для агентов ИИ. Попробуйте Save бесплатно.