Git Commit ในฐานะการค้นพบทางวิทยาศาสตร์: Autoresearch เปลี่ยน Version Control เป็นห้องปฏิบัติการวิจัยได้อย่างไร
ในการพัฒนาซอฟต์แวร์ทั่วไป git commit หมายถึง “โค้ดนี้ทำงานได้” ใน autoresearch ของ Karpathy git commit หมายถึงอะไรบางอย่างที่แตกต่าง: “การเปลี่ยนแปลงนี้ทำให้โมเดลดีขึ้นอย่างวัดได้”
ทุก commit คือการค้นพบทางวิทยาศาสตร์เล็กๆ ทุก git reset คือสมมติฐานที่ไม่เป็นผล git log กลายเป็นสมุดบันทึกการวิจัยที่เขียนโดย AI agent โดยอัตโนมัติ
นี่คือ version control ที่ถูกคิดใหม่ให้เป็นเครื่องมือวิจัย
การตัดสินใจแบบ Binary
การใช้ git ของ autoresearch นั้นเรียบง่ายอย่างสง่างาม:
- Agent แก้ไข
train.py - การฝึกทำงาน 5 นาที
- วัด validation loss
- ถ้าดีขึ้น:
git commit— การเปลี่ยนแปลงนี้เก็บไว้ - ถ้าไม่ดีขึ้น:
git reset— การเปลี่ยนแปลงนั้นไม่เคยเกิดขึ้น
ไม่มี pull request ไม่มี code review ไม่มี merge conflict แค่การตัดสินใจแบบ binary: การเปลี่ยนแปลงนี้ทำให้สิ่งต่างๆ ดีขึ้นหรือไม่?
ซึ่งสร้างประวัติที่สะอาดและเป็นเส้นตรงของการปรับปรุง แต่ละ commit ในล็อกแสดงถึงก้าวไปข้างหน้าที่ได้รับการตรวจสอบแล้ว ไม่มีสัญญาณรบกวน — ไม่มี commit “WIP” ไม่มี commit “fix typo” ไม่มีลูกโซ่ “revert revert” แค่ลำดับการเปลี่ยนแปลงที่แต่ละอันทำให้โมเดลดีขึ้นอย่างวัดได้
Git Log ในฐานะสมุดบันทึกการวิจัย
หลังจาก autoresearch session ข้ามคืน git log อ่านเหมือนสมุดบันทึกการวิจัย:
แต่ละข้อความ commit (เขียนโดย AI agent) อธิบายสิ่งที่เปลี่ยนแปลงและผลที่ได้ diff แสดงว่าโค้ดอะไรถูกแก้ไข การปรับปรุงใน validation loss ถูกบันทึก
นี่คือการตรวจสอบที่ดีกว่าการวิจัย ML แบบดั้งเดิมอย่างมาก แทนที่จะเป็นบันทึกของนักวิจัยที่บอกว่า “ลองปรับ learning rate ดูเหมือนจะช่วย” คุณมี diff ที่แน่นอน การวัดที่แน่นอน และผลลัพธ์ที่ทำซ้ำได้
ความทรงจำข้ามเซสชัน
Git ให้สิ่งที่ AI agents ต้องการอย่างเร่งด่วน: ความทรงจำถาวร
เมื่อคุณเริ่ม autoresearch session ใหม่ agent สามารถอ่านประวัติ git เพื่อเข้าใจสิ่งที่ลองมาก่อน มันเห็นว่าทิศทางไหนที่สร้างการปรับปรุงและทิศทางไหนที่ไม่เป็นผล ซึ่งป้องกัน agent จากการลองการทดลองที่ล้มเหลวซ้ำอีกครั้ง และช่วยสร้างต่อจากสิ่งที่ได้ผล
นี่คือ Markdown และ git ที่ทำงานร่วมกัน: ไฟล์ program.md ให้ทิศทางเชิงกลยุทธ์ (สิ่งที่ต้องลอง) และประวัติ git ให้บริบทเชิงยุทธวิธี (สิ่งที่ได้ลองแล้ว)
ผลสะสม
เพราะแต่ละ commit ที่สำเร็จกลายเป็น baseline ใหม่ การปรับปรุงจะสะสม agent ไม่ได้เริ่มจากศูนย์ทุกคืน — มันเริ่มจากผลลัพธ์ที่ดีที่สุดที่ได้รับจนถึงตอนนี้
ในการรัน 2 วันของ Karpathy มีการสะสมประมาณ 20 การปรับปรุง แต่ละอันเล็ก แต่รวมกันแล้วลดเวลาการฝึก GPT-2 ลง 11% agent พบการปรับแต่ง attention scaling, regularization และ hyperparameter ที่สร้างต่อกัน
นี่คือพลังของแนวทาง git-based: มันสร้าง ratchet ตามธรรมชาติ ความก้าวหน้าถูกล็อคเป็น commit ความล้มเหลวถูกทิ้ง codebase เคลื่อนไปข้างหน้าเท่านั้น
สิ่งที่ถูก Revert
การทดลองที่ล้มเหลว — git reset operations — น่าสนใจพอๆ กับความสำเร็จ ในการรันข้ามคืนทั่วไป ประมาณ 70-80% ของการทดลองถูก revert
การทดลองที่ถูก revert เหล่านี้ไม่ได้สูญเปล่า พวกมันเป็นผลลัพธ์เชิงลบที่แจ้งการตัดสินใจในอนาคตของ agent ด้วย cross-agent memory และประวัติ git ที่แชร์กัน ระบบ autoresearch แบบกระจายสามารถเรียนรู้จากความล้มเหลวทั่วทั้ง swarm
Git ในฐานะฐานข้อมูลการทดลอง
การวิจัย ML ดั้งเดิมใช้เครื่องมือติดตามการทดลอง — MLflow, Weights & Biases, Neptune — เพื่อบันทึก hyperparameter เมตริก และ artifact
autoresearch แทนที่ทั้งหมดนี้ด้วย git ประวัติ commit คือ experiment log diffs คือการเปลี่ยน hyperparameter ข้อความ commit คือคำอธิบายการทดลอง
การทำให้เรียบง่ายนี้ทรงพลัง ไม่มีฐานข้อมูลการทดลองแยกต่างหากที่ต้องดูแล ไม่มี dashboard ที่ต้องกำหนดค่า ไม่มี schema ที่ต้องกำหนด แค่ git ซึ่งทุกนักพัฒนารู้จักอยู่แล้ว
รูปแบบที่กว้างกว่า
รูปแบบ git-as-research-journal ใช้งานได้นอกเหนือจากการฝึก ML:
- การปรับแต่งโค้ด: แต่ละ commit แสดงถึงการเปลี่ยนแปลงที่ทำให้โค้ดเร็วขึ้น
- Test coverage: แต่ละ commit แสดงถึงการเปลี่ยนแปลงที่ปรับปรุง test coverage
- Bug fixing: แต่ละ commit แสดงถึงการแก้ไขที่แก้ปัญหา failing test
- การปรับแต่งเนื้อหา: แต่ละ commit แสดงถึงการเปลี่ยนแปลงที่ปรับปรุงเมตริกที่วัดได้
ทุกโดเมนที่คุณสามารถวัด “ดีขึ้น” และ “แย่ลง” โดยอัตโนมัติสามารถใช้ git เป็น experiment tracker ได้
บทบาทของมนุษย์: การอ่าน Log
ใน agentic engineering กิจวัตรยามเช้าของมนุษย์หลัง autoresearch session ข้ามคืนคือการอ่าน git log
ทักษะนี้แตกต่างจากการเขียนโค้ด คุณกำลังประเมินลำดับการเปลี่ยนแปลงที่ AI สร้าง เข้าใจว่าทำไมแต่ละอันได้ผล และตัดสินใจว่าทิศทางโดยรวมถูกต้องหรือไม่ จากการทบทวนนี้ คุณอัปเดต program.md เพื่อชี้นำเซสชันถัดไป
git log คือช่องทางการสื่อสารระหว่างมนุษย์และ agent agent สื่อสารผ่าน commit มนุษย์สื่อสารผ่านการอัปเดต program.md Markdown ไหลในทั้งสองทิศทาง
การสร้างความรู้ที่เป็นมิตรกับ Git
การเขียนไฟล์ program.md ที่มีประสิทธิภาพ — ชนิดที่สร้างประวัติ git ที่สะอาดและมีความหมาย — ต้องการความเข้าใจทั้งโดเมนและเครื่องมือ คำแนะนำ agent ที่ดีที่สุดมาจากคนที่ศึกษาปัญหาอย่างลึกซึ้ง
การบันทึกวัสดุอ้างอิงเป็น Markdown สะอาดสร้างฐานความรู้ที่คุณสามารถดึงมาใช้เมื่อเขียนคำแนะนำ agent เอกสาร บทความวิจัย และแนวปฏิบัติที่ดีที่สุด ทั้งหมดในรูปแบบที่ไหลเป็นธรรมชาติเข้าสู่ program.md และสุดท้ายเป็นประวัติ git ของการค้นพบ
Save แปลงหน้าเว็บใดก็ได้เป็น Markdown สะอาด — สร้างคลังความรู้ที่ขับเคลื่อนคำแนะนำ AI agent ที่มีประสิทธิภาพและการวิจัยแบบอัตโนมัติ ลอง Save ฟรี