AI Araştırması için arXiv Makalelerini Markdown'a Nasıl Dönüştürürsünüz
arXiv makaleleri PDF’tir. PDF’ler AI iş akışları için berbattır. Düzgün aranamaz, LLM’lere beslendiğinde token israf eder ve bir bilgi tabanındaki diğer araştırma materyalleriyle kolayca birleştirilemez.
AI araştırması yapıyorsanız — veya arXiv’e dayanan herhangi bir alanda — makaleleri Markdown’a dönüştürmek her şeyi değiştirir.
Araştırma Makaleleri için Neden Markdown?
LLM’ler Markdown’ı doğal olarak anlar. Claude veya ChatGPT’ye PDF besleyin, biçimlendirme, sayfa sonları ve iki sütunlu düzenlerle mücadele eder. Markdown besleyin ve mükemmel okur — her denklem, her kod bloğu, her referans.
10 kat daha az token. Tipik bir arXiv makalesi PDF olarak 200-500KB’dır. Aynı içerik Markdown’da 10-30KB’dır. Bu, tek bir Claude bağlam penceresine 10 kat daha fazla makale sığdırabileceğiniz anlamına gelir.
Tüm kütüphanenizdeki arama. Bir klasörde 50 makale Markdown dosyası olarak bulunduğunda, milisaniyeler içinde hepsinde herhangi bir kavramı grep’leyebilirsiniz. Bunu PDF’lerle deneyin.
Obsidian ile çalışır. Obsidian’da Markdown dosyaları olarak makaleler bağlantılı, etiketlenmiş ve aranabilir hale gelir. Satır içi kendi notlarınızı ekleyin. [[wikilinks]] ile makaleler arasında bağlantılar oluşturun.
arXiv Makalelerini Markdown Olarak Nasıl Kaydedilir
Yöntem 1: Save Uzantısı (Önerilen)
Save, arXiv özet sayfasını (ve birçok HTML işlenmiş makaleyi) temiz Markdown’a dönüştürür.
- arXiv makale sayfasını açın (örn.
arxiv.org/abs/2401.12345) - Save uzantısı simgesine tıklayın
- Başlık, yazarlar, özet ve mevcut içerikle bir Markdown dosyası alın
HTML sürümüne sahip makaleler için (arXiv’de giderek yaygınlaşıyor), Save denklemler, şekil referansları ve alıntılar dahil tam makale içeriğini çıkarır.
Yöntem 2: arXiv HTML + Save
Birçok yeni makalenin arXiv’de HTML sürümü bulunur (PDF’nin yanındaki “HTML” bağlantısına bakın). HTML sürümünü açın ve Save’i kullanın — tam makaleyi temiz Markdown olarak alırsınız.
Yöntem 3: Semantic Scholar veya Papers With Code
Bu siteler genellikle makalelerin daha temiz HTML işlemelerine sahiptir. Makale sayfasını açın ve Save’i kullanın.
Araştırma Bilgi Tabanı Oluşturma
Gerçek güç, zamanla makaleleri biriktirmekten gelir:
research/
attention/
attention-is-all-you-need.md
flash-attention-v2.md
multi-head-latent-attention.md
scaling/
chinchilla-scaling-laws.md
scaling-data-constrained.md
agents/
toolformer.md
react-prompting.md
mcp-protocol.md
Claude Code’u bu klasöre yöneltin:
cd research
claude
Artık sorabilirsiniz: “Bu makalelerdeki dikkat mekanizmalarını karşılaştır” veya “Ölçekleme yasaları hakkındaki temel bulgular nelerdir?” Claude tüm makalelerinizi okur ve gerçek araştırmaya dayalı yanıtlar sentezler.
Karpathy Deseni
Andrej Karpathy bu yaklaşımı şöyle anlattı: markdown dosyalarından oluşan kişisel bir wiki oluşturun, bir LLM’in bunları araştırmasına izin verin. AI araştırmacıları için bu şu anlama gelir:
- Her önemli makaleyi Markdown olarak kaydedin
- Konuya göre düzenleyin
- Kendi notlarınızı ve açıklamalarınızı ekleyin
- Claude veya ChatGPT’nin tam koleksiyon üzerinde çalışmasına izin verin
Birkaç ay sonra, okuduğunuz her makaleyi bilen kişisel bir araştırma asistanınız olur.
Başlarken
Save’i yükleyin ve okuduğunuz bir sonraki arXiv makalesiyle başlayın. Zaman içinde Markdown araştırma kütüphaneniz hiçbir genel AI’ın karşılayamayacağı bir şeye dönüşür.
arXiv makalelerini aranabilir, AI tarafından okunabilir bir bilgi tabanına dönüştürün. Save’i yükleyin — başlamak ücretsiz.