Andrej Karpathy a récemment partagé comment il utilise des fichiers markdown pour construire des bases de connaissances personnelles pour la recherche en IA. Son approche est simple : collecter des documents sources, les convertir en markdown, les organiser dans un dossier, et laisser un LLM travailler avec l’ensemble de la collection.

Le résultat ? Une IA qui sait vraiment ce que vous savez.

Ce n’est pas une technique réservée aux chercheurs. Toute personne qui utilise Claude, ChatGPT ou un LLM au quotidien peut construire la même chose --- et ça prend des minutes, pas des heures.

Qu’est-ce qu’une base de connaissances LLM ?

C’est un dossier sur votre ordinateur rempli de fichiers markdown sur des sujets qui vous intéressent. Des articles que vous avez lus. Des vidéos YouTube que vous avez regardées. De la documentation que vous consultez. Des tweets qui ont façonné votre réflexion.

Quand vous donnez à un LLM accès à ce dossier, il cesse d’être un assistant générique. Il devient votre assistant --- un assistant qui comprend votre domaine, vos sources et votre contexte.

Pensez-y comme à un second cerveau, mais que votre IA peut vraiment lire.

Étape 1 : Collectez vos sources avec Save

C’est là que la plupart des gens bloquent. Copier manuellement du contenu web, nettoyer le HTML, le formater --- c’est fastidieux. C’est exactement ce que Save résout.

Save est une extension Chrome qui convertit n’importe quelle page web en markdown propre et structuré. En un clic.

Ce que vous pouvez sauvegarder :

Articles et billets de blog
Vidéos YouTube (transcription complète + résumé)
Fils Twitter/X
Documentation et références API
Discussions Reddit
Articles académiques
Publications LinkedIn
Contenu payant auquel vous avez accès

Chaque sauvegarde produit un fichier .md propre --- pas de HTML, pas de publicités, pas de menus de navigation. Juste le contenu, correctement structuré avec des titres, des listes et des blocs de code.

Étape 2 : Organisez votre dossier de connaissances

Créez une structure de dossiers adaptée à votre travail. Restez simple :

my-knowledge/
  marketing/
    distribution-strategies.md
    competitor-analysis.md
    pricing-frameworks.md
  product/
    user-research-findings.md
    feature-prioritization.md
  industry/
    market-trends-2026.md
    karpathy-llm-knowledge-bases.md
    ai-agent-workflows.md

Chaque fois que vous lisez quelque chose de précieux en ligne, sauvegardez-le avec Save et déposez-le dans le bon dossier. Au fil du temps, cela se transforme en une base de connaissances complète qu’aucun LLM générique ne peut égaler.

Étape 3 : Connectez votre base de connaissances à un LLM

C’est là que ça devient puissant. Il existe plusieurs façons de donner à un LLM accès à votre dossier de connaissances :

Option 1 : Claude Code (la plus puissante)

Si vous utilisez Claude Code, ouvrez un terminal dans votre dossier de connaissances et démarrez une session. Claude obtient un accès complet à chaque fichier et peut rechercher, lire, croiser et raisonner sur l’ensemble de votre collection.

cd my-knowledge
claude

Claude Code peut lire des centaines de fichiers markdown, trouver des connexions entre eux, répondre à des questions complexes et même maintenir des fichiers d’index --- exactement comme Karpathy le décrit.

C’est l’option la plus puissante car Claude peut activement parcourir vos fichiers, pas seulement les recevoir en contexte.

Option 2 : Claude.ai Projects

Créez un Projet sur claude.ai et téléversez vos fichiers markdown dans la base de connaissances du projet. Chaque conversation dans ce projet aura accès à vos documents.

Glissez-déposez les fichiers directement
Supporte 200+ fichiers par projet
Les connaissances persistent d’une conversation à l’autre
Fonctionne sur n’importe quel appareil avec un navigateur

Idéal pour : ceux qui veulent une configuration simple sans utiliser le terminal.

Option 3 : Claude Desktop + MCP

Si vous utilisez Claude Desktop, vous pouvez installer le serveur MCP filesystem pour donner à Claude un accès direct à un dossier sur votre ordinateur.

Ajoutez ceci à votre configuration Claude Desktop :

{
  "mcpServers": {
    "knowledge-base": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "/path/to/my-knowledge"
      ]
    }
  }
}

Claude Desktop peut alors lire n’importe quel fichier dans votre dossier de connaissances à la demande --- sans téléversement nécessaire.

Option 4 : Copier-coller (la plus simple)

Pour des questions rapides, glissez simplement un ou quelques fichiers markdown dans n’importe quelle conversation Claude ou ChatGPT. Aucune configuration requise.

Cela fonctionne pour des requêtes ponctuelles mais ne s’adapte pas à grande échelle. Pour un véritable flux de travail avec base de connaissances, utilisez l’une des options ci-dessus.

Pourquoi Markdown rend tout cela possible

On ne peut pas donner du HTML brut à un LLM et espérer de bons résultats. Le HTML est alourdi par la navigation, les publicités, les scripts et le style --- du bruit qui gaspille des tokens et perturbe le modèle.

Markdown est le langage natif des LLMs. Ils ont été entraînés sur des millions de fichiers markdown provenant de GitHub, de sites de documentation et de blogs de développeurs. Quand vous donnez du markdown propre à un LLM :

10 fois moins de tokens comparé au HTML brut
Meilleure compréhension --- le modèle se concentre sur le contenu, pas sur le parsing
Structure correcte --- les titres, listes et blocs de code sont préservés
Compatibilité universelle --- fonctionne avec Claude, ChatGPT, Gemini ou n’importe quel LLM

C’est pourquoi Save existe. Il ne copie pas juste du texte --- il utilise l’IA pour extraire le contenu pertinent et le structurer en markdown propre que les LLMs comprennent parfaitement.

L’effet cumulatif

Voici ce qui se passe quand vous développez cette habitude :

Semaine 1 : Vous avez 10 fichiers markdown. Claude peut répondre à des questions sur ces articles spécifiques.

Mois 1 : Vous avez 50+ fichiers. Claude peut croiser des sources, trouver des patterns et vous donner des insights que vous n’auriez jamais repérés seul.

Mois 3 : Vous avez 200+ fichiers. Vous avez construit un assistant de recherche personnel qui connaît votre secteur, vos concurrents, vos frameworks et votre façon de penser. Chaque question que vous posez obtient une réponse ancrée dans vos connaissances soigneusement sélectionnées, pas dans des données d’entraînement génériques.

Comme Karpathy l’a noté, une fois que votre base de connaissances est suffisamment grande, vous pouvez poser des questions complexes et le LLM recherchera les réponses dans l’ensemble de votre collection. Pas besoin d’une configuration RAG sophistiquée --- juste des fichiers markdown bien organisés.

Commencer en 60 secondes

Installez Save depuis le Chrome Web Store (gratuit)
Créez un dossier my-knowledge sur votre ordinateur
Visitez un article que vous avez trouvé précieux récemment
Cliquez sur Save --- le fichier markdown se télécharge instantanément
Déplacez-le dans votre dossier de connaissances
Ouvrez le dossier dans Claude Code, téléversez-le dans un Projet Claude, ou configurez le MCP

Chaque article que vous sauvegardez à partir de maintenant rend votre IA plus intelligente. Ça se cumule.

Commencez à construire votre base de connaissances LLM aujourd’hui. Installez Save --- c’est gratuit pour commencer.