Cómo construir una base de conocimiento para LLMs con Save

Andrej Karpathy compartió recientemente cómo usa archivos markdown para construir bases de conocimiento personales para investigación en IA. Su enfoque es simple: recolectar documentos fuente, convertirlos a markdown, organizarlos en una carpeta y dejar que un LLM trabaje con toda la colección.

¿El resultado? Una IA que realmente sabe lo que tú sabes.

Esta no es una técnica exclusiva para investigadores. Cualquier persona que use Claude, ChatGPT o cualquier LLM a diario puede construir lo mismo --- y toma minutos, no horas.

¿Qué es una base de conocimiento LLM?

Es una carpeta en tu computadora llena de archivos markdown sobre temas que te importan. Artículos que has leído. Videos de YouTube que has visto. Documentación que consultas. Tweets que han dado forma a tu pensamiento.

Cuando le das a un LLM acceso a esta carpeta, deja de ser un asistente genérico. Se convierte en tu asistente --- uno que entiende tu dominio, tus fuentes y tu contexto.

Piénsalo como un segundo cerebro, pero uno que tu IA puede leer de verdad.

Paso 1: Recopila tus fuentes con Save

Aquí es donde la mayoría de las personas se atasca. Copiar manualmente contenido web, limpiar el HTML, formatearlo --- es tedioso. Eso es exactamente lo que Save resuelve.

Save es una extensión de Chrome que convierte cualquier página web en markdown limpio y estructurado. Con un solo clic.

Lo que puedes guardar:

Artículos y publicaciones de blog
Videos de YouTube (transcripción completa + resumen)
Hilos de Twitter/X
Documentación y referencias de API
Discusiones de Reddit
Artículos académicos
Publicaciones de LinkedIn
Contenido de pago al que tienes acceso

Cada guardado produce un archivo .md limpio --- sin HTML, sin anuncios, sin menús de navegación. Solo el contenido, correctamente estructurado con encabezados, listas y bloques de código.

Paso 2: Organiza tu carpeta de conocimiento

Crea una estructura de carpetas que tenga sentido para tu trabajo. Mantenlo simple:

my-knowledge/
  marketing/
    distribution-strategies.md
    competitor-analysis.md
    pricing-frameworks.md
  product/
    user-research-findings.md
    feature-prioritization.md
  industry/
    market-trends-2026.md
    karpathy-llm-knowledge-bases.md
    ai-agent-workflows.md

Cada vez que leas algo valioso en línea, guárdalo con Save y colócalo en la carpeta correcta. Con el tiempo, esto se acumula hasta convertirse en una base de conocimiento completa que ningún LLM genérico puede igualar.

Paso 3: Conecta tu base de conocimiento a un LLM

Aquí es donde se vuelve poderoso. Hay varias formas de dar a un LLM acceso a tu carpeta de conocimiento:

Opción 1: Claude Code (la más poderosa)

Si usas Claude Code, abre una terminal en tu carpeta de conocimiento e inicia una sesión. Claude obtiene acceso completo a cada archivo y puede buscar, leer, hacer referencias cruzadas y razonar sobre toda tu colección.

cd my-knowledge
claude

Claude Code puede leer cientos de archivos markdown, encontrar conexiones entre ellos, responder preguntas complejas e incluso mantener archivos de índice --- exactamente como describe Karpathy.

Esta es la opción más poderosa porque Claude puede explorar activamente tus archivos, no solo recibirlos como contexto.

Opción 2: Claude.ai Projects

Crea un Proyecto en claude.ai y sube tus archivos markdown a la base de conocimiento del proyecto. Cada conversación en ese proyecto tendrá acceso a tus documentos.

Arrastra y suelta archivos directamente
Admite más de 200 archivos por proyecto
El conocimiento persiste entre conversaciones
Funciona en cualquier dispositivo con un navegador

Ideal para: personas que quieren una configuración simple sin usar la terminal.

Opción 3: Claude Desktop + MCP

Si usas Claude Desktop, puedes instalar el servidor MCP de sistema de archivos para dar a Claude acceso directo a una carpeta en tu computadora.

Agrega esto a tu configuración de Claude Desktop:

{
  "mcpServers": {
    "knowledge-base": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "/path/to/my-knowledge"
      ]
    }
  }
}

Claude Desktop puede entonces leer cualquier archivo en tu carpeta de conocimiento bajo demanda --- sin necesidad de subir archivos.

Opción 4: Copiar y pegar (la más simple)

Para preguntas rápidas, simplemente arrastra uno o unos pocos archivos markdown a cualquier conversación de Claude o ChatGPT. No se requiere configuración.

Esto funciona para consultas puntuales, pero no escala. Para un flujo de trabajo real con base de conocimiento, usa una de las opciones anteriores.

Por qué Markdown hace que todo esto funcione

No puedes darle HTML crudo a un LLM y esperar buenos resultados. El HTML está sobrecargado de navegación, anuncios, scripts y estilos --- ruido que desperdicia tokens y confunde al modelo.

Markdown es el lenguaje nativo de los LLMs. Fueron entrenados en millones de archivos markdown de GitHub, sitios de documentación y blogs de desarrolladores. Cuando le das markdown limpio a un LLM:

10 veces menos tokens comparado con HTML crudo
Mejor comprensión --- el modelo se enfoca en el contenido, no en el análisis sintáctico
Estructura correcta --- se preservan encabezados, listas y bloques de código
Compatibilidad universal --- funciona con Claude, ChatGPT, Gemini o cualquier LLM

Por eso existe Save. No solo copia texto --- usa IA para extraer el contenido significativo y estructurarlo como markdown limpio que los LLMs entienden perfectamente.

El efecto compuesto

Esto es lo que sucede cuando construyes este hábito:

Semana 1: Tienes 10 archivos markdown. Claude puede responder preguntas sobre esos artículos específicos.

Mes 1: Tienes 50+ archivos. Claude puede hacer referencias cruzadas entre fuentes, encontrar patrones y darte ideas que nunca habrías detectado por tu cuenta.

Mes 3: Tienes 200+ archivos. Has construido un asistente de investigación personal que conoce tu industria, tus competidores, tus marcos de trabajo y tu forma de pensar. Cada pregunta que haces obtiene una respuesta basada en tu conocimiento curado, no en datos de entrenamiento genéricos.

Como señaló Karpathy, una vez que tu base de conocimiento es lo suficientemente grande, puedes hacer preguntas complejas y el LLM investigará las respuestas en toda tu colección. No se necesita una configuración RAG sofisticada --- solo archivos markdown bien organizados.

Empieza en 60 segundos

Instala Save desde la Chrome Web Store (gratis)
Crea una carpeta my-knowledge en tu computadora
Visita un artículo que hayas encontrado valioso recientemente
Haz clic en Save --- el archivo markdown se descarga al instante
Muévelo a tu carpeta de conocimiento
Abre la carpeta en Claude Code, súbela a un Proyecto de Claude o configura MCP

Cada artículo que guardes de ahora en adelante hace a tu IA más inteligente. Se acumula con interés compuesto.

Empieza a construir tu base de conocimiento LLM hoy. Instala Save --- es gratis para empezar.

Cómo construir una base de conocimiento para LLMs con Save

¿Qué es una base de conocimiento LLM?

Paso 1: Recopila tus fuentes con Save

Paso 2: Organiza tu carpeta de conocimiento

Paso 3: Conecta tu base de conocimiento a un LLM

Opción 1: Claude Code (la más poderosa)

Opción 2: Claude.ai Projects

Opción 3: Claude Desktop + MCP

Opción 4: Copiar y pegar (la más simple)

Por qué Markdown hace que todo esto funcione

El efecto compuesto

Empieza en 60 segundos

## Continue reading

Cómo guardar una conversación de Claude en Markdown (Artifacts, citas, Projects)

Los wikis en Markdown están reemplazando silenciosamente a RAG. Te explicamos por qué.

Karpathy usa Obsidian Web Clipper. Save Vault hace lo mismo — con Claude integrado

Cómo guardar una conversación de ChatGPT como Markdown (cada turno, bloques de código intactos)

Jean-Sébastien Wallez