← 返回部落格

Shopify 的 19% 提升:企業如何已經在使用 Autoresearch 模式

· Save Team
aiautoresearchshopifykarpathybusinessmachine-learningreal-world

當 Karpathy 在 2026 年 3 月 7 日發布 autoresearch 時,企業開始執行它只花了幾天——不是幾週,不是幾個月。

最值得注意的早期採用者:Shopify CEO Tobi Lutke,他為內部項目改編了 autoresearch 框架。結果?在 8 小時內只有 37 個實驗後,一個訓練了一夜的 0.8 億參數模型比之前的 16 億參數模型高出 19%

更小的模型。更好的結果。整夜沒有人工干預。

商業中的 Autoresearch 模式

Shopify 展示的不只是一個可愛的機器學習實驗。這是一種企業進行研發的新方式的概念驗證。

傳統方法:僱用機器學習工程師,讓他們手動執行實驗,在會議中審查結果,決定下一步,緩慢地重複。一個好的團隊每月可能執行 30 個集中的實驗。

Autoresearch 方法:撰寫定義目標的 program.md,讓 AI 代理程式整夜執行實驗,早上審查結果。一個工程師,一個 GPU,每晚 100+ 個實驗。

數學是壓倒性的。手動研究每位研究人員每天產生約 1 個實驗。Autoresearch 每小時產生約 12 個。這是實驗吞吐量的 100 倍增加。

超越機器學習:每年 36,500 個實驗

這個模式超越了模型訓練。行銷團隊通常每年執行約 30 個實驗——A/B 測試、文案變體、受眾定位變化。這很緩慢,因為每個實驗都需要人工設定、監控和分析。

早期採用者已經在想像一個自主代理程式每天執行 100 個行銷實驗、衡量轉換率、調整文案並迭代定位的世界——全部由定義品牌目標和約束的 program.md 指導。

這是每年 36,500+ 個實驗,而不是 30 個。最先採用這種模式的公司將擁有幾乎不可能追上的複利優勢。

是什麼讓 Shopify 的結果成為可能

Shopify 的 19% 提升不是運氣。幾個因素使它起作用:

明確的指標。 他們有一個代理程式在每次實驗後可以自動測量的定義良好的評估指標。沒有自動化測量,循環就會中斷。

受限的範圍。 與 Karpathy 的 630 行 train.py 一樣,Shopify 將可修改的程式碼庫保持在足夠小的範圍內,讓 LLM 完全理解。您不能把百萬行程式碼庫扔給代理程式然後期望最好的結果。

好的初始指令。 指導代理程式的 program.md 是由團隊的領域知識提供資訊的。代理程式不是隨機搜尋——它正在探索團隊識別為有前景的方向。

對過程的信任。 他們讓它整夜執行而不干預。每小時檢查和調整的誘惑違背了自主實驗的目的。

通宵執行模式

典型的 autoresearch 採用遵循一種模式:

第 1 天: 設定環境,撰寫第一個 program.md,手動執行幾個實驗以驗證循環有效。

第 1 晚: 在離開前啟動代理程式。設定它無限期執行,提交改進並恢復失敗。

第 2 天早晨: 審查 git 日誌。看看代理程式嘗試了什麼,什麼有效,什麼沒有。根據您學到的內容更新您的 program.md

第 2 晚: 以改進的指令再次執行。代理程式從第 1 晚的最佳結果開始。

一週內: 您有一個精煉的 program.md 和數十個經過驗證的改進,這需要人類團隊幾個月才能發現。

成熟採用此模式的行業

任何涉及系統性實驗的領域都可以採用 autoresearch 循環:

機器學習 — 原始使用案例。超參數調整、架構搜索、正則化實驗。

軟體最佳化 — 效能調整、套件大小縮減、查詢最佳化。任何有可測量指標和可修改程式碼的地方。

藥物發現 — 具有可測量結合親和力的分子模擬。實驗是計算性的,指標是數值的,循環是可自動化的。

金融建模 — 對歷史數據進行交易策略回測。明確的指標,快速的反饋,巨大的搜索空間。

內容最佳化 — 以轉換率為指標的標題、版面和文案的 A/B 測試。

Markdown 的優勢

在每種情況下,人類的貢獻都是相同的:一個 Markdown 檔案,定義要最佳化什麼、要尊重什麼約束,以及要嘗試哪些策略。

這就是為什麼 Markdown 素養正在成為競爭優勢。撰寫最好的 program.md 檔案的公司從自主代理程式中獲得最好的結果。而撰寫好的 program.md 檔案需要以 AI 可以使用的格式組織的深厚領域知識。

建立參考資料庫的公司——將文件、競品分析、研究論文和最佳實踐儲存為乾淨的 Markdown——占有先機。當需要撰寫指導通宵實驗的 program.md 時,他們可以從精心策劃的知識庫中提取,而不是從頭開始。


Save 將任何網頁轉換為乾淨的 Markdown——建立企業撰寫有效 AI 代理程式指令所需的知識庫。免費試用 Save