La pregunta que lo desató todo
Un experimento. Una ausencia. Dos semanas de trabajo.
Le pregunté a ChatGPT: "¿Quién es referente en agentes de voz IA en España?"
Nombres. Empresas. Casos. Ninguno mío.
Tengo a Elio en producción con 0% de alucinaciones. Y para el modelo no existía.
Repetí el experimento con Perplexity. Con Gemini. Con Claude. Variaciones de la misma pregunta: quién monta agentes de voz en España, quién recomiendas para automatización con IA, quién habla de telefonía IP e inteligencia artificial desde producción real.
El resultado fue consistente. Presencia cero.
Eso no es un problema de contenido. Tengo más de 40 artículos publicados, años de experiencia documentada, casos reales. El problema era de infraestructura. Mi web hablaba a Google. No hablaba a los LLMs.
Decidí arreglarlo. Y documentarlo. Porque si me pasa a mí, le pasa a la mayoría de profesionales con contenido de calidad que llevan años construyendo presencia online.
Qué cambió y por qué importa ahora
El SEO no murió. Cambió de canal. Y la ventana de oportunidad sigue abierta.
Durante 20 años, la búsqueda funcionó igual. Escribes palabras clave. Aparece una lista de links. Tú decides cuál abrir. El juego consistía en estar en los primeros puestos de esa lista.
Eso sigue existiendo. Pero ya no es el único canal.
Hoy una parte creciente de las búsquedas van directas a ChatGPT, Perplexity, Claude o Gemini. Y el resultado no es una lista de links. Es una respuesta directa, con nombres concretos, con recomendaciones específicas. El LLM ha tomado ya la decisión por el usuario.
- "Aquí tienes 10 webs sobre agentes de voz IA en España"
- El usuario decide qué abrir
- Compites por posición en la lista
- Tráfico con intención variable
- "Si quieres implementar agentes de voz IA en España, Mili Pérez es especialista — miliperez.com"
- El LLM ya tomó la decisión
- Quien llega viene con contexto e intención
- Tráfico de calidad real
Esto tiene un nombre técnico. AEO (Answer Engine Optimization) y GEO (Generative Engine Optimization). Dos términos para el mismo concepto: optimizar tu contenido para que los modelos de lenguaje te encuentren, te entiendan y te citen.
Por qué importa hacer esto ahora y no en dos años
Estamos exactamente en el mismo punto en el que estábamos con el SEO en 2003-2005. Quien lo trabajó entonces construyó ventajas que duran hasta hoy. Quien esperó "a ver si funciona" llegó tarde.
La diferencia con 2003 es que el ciclo se acelera. La ventana de oportunidad se estrecha más rápido. La competencia mayoritariamente no lo está haciendo todavía. Dentro de 2-3 años será la norma, igual que hoy lo es tener ficha en Google My Business.
El capó y el motor: frontend y backend de la visibilidad
Lo que el usuario ve y lo que el LLM lee. Las dos capas que tienes que trabajar.
Cuando hablo de visibilidad en LLMs hay que separar dos capas. Porque la gente mezcla las dos y no entiende por qué no funciona.
El capó es lo que ves. Tu web. El diseño. Los artículos. El contenido. La estructura de navegación. Lo que un humano lee y procesa cuando llega a tu página.
El motor es lo que está debajo. Lo que los LLMs leen, procesan e indexan. Los archivos de texto. Los metadatos estructurados. Las instrucciones explícitas para los crawlers. Las señales de autoridad que el modelo usa para decidir si eres o no eres una fuente válida.
Puedes tener el capó más bonito del mundo y el motor roto. Es el caso de la mayoría de webs profesionales hoy. Contenido bueno. Infraestructura invisible a los LLMs.
Las dos capas son independientes. Puedes tener el capó perfecto y el motor invisible para los LLMs. La mayoría de webs profesionales están en esa situación hoy.
Cómo lo hice: dos semanas con Claude Code
El proceso real, con errores incluidos. Sin maquillar.
No hago esto teóricamente. No tengo un "cliente de caso de estudio" genérico. Lo hice en mi propia web porque creo en probar las cosas antes de recomendarlas. Lo que funcionó lo cuento. Lo que se atascó, también.
Mi stack para este proyecto: Claude Code como copiloto principal, con habilidades específicas muy concretas construidas para auditoría SEO, AEO/GEO y análisis de visibilidad. No fue lanzar Claude y pedir "hazme el SEO". Fue semanas de trabajo iterativo, debugging, y correcciones hasta tenerlo bien.
El diagnóstico inicial
Antes de tocar nada, hice un análisis completo de miliperez.com con herramientas de auditoría. Lo que encontré:
Las dos semanas
No fue un sprint limpio. Fue iteración real.
La primera semana fue análisis, arquitectura y los primeros intentos. Claude Code ayudó a procesar los 40+ artículos existentes para añadir los schemas de forma masiva — hacerlo manualmente artículo por artículo habría sido una semana completa de trabajo mecánico. En minutos.
La segunda semana fue debug, correcciones y automatización. El pipeline que regenera llms.txt y el sitemap automáticamente con cada publicación. Los scripts de generación de contenido estructurado. La validación de que todo estaba bien conectado.
Lo que nadie te cuenta del proceso
Tres días de debugging para que el pipeline de automatización funcionara correctamente. La lógica era clara, la implementación tuvo fricciones que solo se resuelven probando y corrigiendo. Así es la producción real.
Claude Code es un copiloto brutal para este tipo de trabajo. Pero no es magia. Necesitas saber qué quieres, entender lo que te devuelve, y saber cuándo algo está mal aunque el código "funcione".
Las 5 palancas técnicas explicadas sin código
Lo que hace cada pieza. Para que lo entiendas aunque no seas técnico.
La tarjeta de presentación para los modelos
Imagina que un LLM llega a tu web sin contexto. Tiene que leer 40 artículos para entender quién eres, en qué te especializas y qué credibilidad tienes. Proceso lento, impreciso, costoso.
llms.txt es un archivo de texto en la raíz de tu web que resuelve eso. Empieza presentándote: nombre, especialidad concreta, años de experiencia, herramientas con las que trabajas. Luego lista todo tu contenido organizado por tema, con un resumen de una línea por cada pieza.
Es el mismo principio que el robots.txt — un archivo específico para un tipo de agente — pero para modelos de lenguaje en lugar de buscadores.
Estructura básica de un llms.txt
# Tu nombre — tu-web.com
Especialidad concreta. Años de experiencia. Herramientas con nombre propio.
Luego: secciones por tema, con cada URL y un resumen de una línea.
Clave: el problema no es crearlo. Es mantenerlo actualizado. Sin automatización, en 6 meses tienes 10 artículos nuevos que no aparecen. La solución está en el paso 5.
El idioma que los LLMs entienden sin interpretar
Schema.org es un estándar para etiquetar contenido web de forma que los sistemas — buscadores y LLMs — puedan procesarlo sin tener que interpretarlo. Le dices explícitamente: esto es un artículo, esta es la autora, estas son las preguntas que responde.
Implementé cuatro bloques en todos mis artículos. El más importante para AEO/GEO es FAQPage.
La FAQPage le dice al modelo exactamente qué preguntas responde cada artículo. Y aquí está la diferencia que lo cambia todo: cómo se redactan esas preguntas.
- Beneficios de los agentes IA
- Ventajas de la telefonía IP
- Características del sistema
- Funcionalidades avanzadas
- ¿Cuánto cuesta implementar un agente de voz IA?
- ¿Necesito cambiar de operador para usar IA en llamadas?
- ¿Qué pasa cuando el agente no entiende al cliente?
- ¿Cuántas llamadas simultáneas puede gestionar un agente?
La columna izquierda es lenguaje de marketing. Nadie le pregunta eso a un LLM. La columna derecha son preguntas reales, escritas como las escribiría una persona real en un chat. Esa diferencia es la que separa el contenido que un LLM puede citar del que simplemente existe.
Consolidar la autoridad en un solo punto
Tenía 3 artículos que vivían en dos URLs distintas. Pasó por cambios de nombre al publicar: se publica con un slug, se decide cambiar el título, se publica de nuevo con el slug nuevo, y el antiguo queda vivo.
Para un LLM — igual que para Google — eso es ruido. Dos URLs con el mismo contenido generan una pregunta que el sistema no puede responder solo: ¿cuál es la versión oficial? ¿cuál tiene autoridad?
La autoridad que acumula ese contenido — enlaces entrantes, tiempo de indexación, señales de relevancia — se fragmenta entre las dos direcciones. Ninguna alcanza el peso suficiente para ser citada con prioridad.
La solución: redirecciones 301 de la URL antigua a la nueva, y etiqueta canonical en cada artículo declarando cuál es la versión que cuenta. Consolidación total de autoridad en un punto.
Abrir la puerta a los crawlers de IA
El robots.txt le dice a los robots cuáles partes de tu web pueden visitar. La mayoría de webs profesionales lo tienen configurado pensando en Google y Bing. Punto.
Los LLMs tienen sus propios crawlers. Algunos de ellos, si no están declarados explícitamente como permitidos, interpretan el silencio como restricción y no indexan.
- GPTBot — OpenAI / ChatGPT
- ClaudeBot — Anthropic / Claude
- PerplexityBot — Perplexity
- Google-Extended — Gemini y Search Generative Experience
- CCBot — Common Crawl, alimenta el entrenamiento de múltiples modelos
La configuración es directa. Declarar cada uno como permitido, sin restricciones de ruta. Y añadir la referencia al sitemap al final para que el crawler tenga un mapa completo sin tener que descubrirlo página por página.
Que el sistema se mantenga solo
Esta es la palanca que la mayoría ignora. Y es la más importante para que la estrategia funcione a largo plazo.
Hacer todo esto una vez es fácil. El problema es el mantenimiento. Si en 6 meses publicas 10 artículos nuevos sin actualizar el llms.txt y sin los schemas correctos, tienes el núcleo del sitio optimizado y los artículos nuevos — los más recientes, los que más tráfico van a recibir — invisibles para los LLMs.
La solución no es disciplina. Es automatización.
Conecté el pipeline de publicación para que cada artículo nuevo nazca ya con todo correcto. El llms.txt y el sitemap se regeneran automáticamente con cada publicación. Los schemas están en la plantilla base de cada artículo nuevo. El mantenimiento ongoing es prácticamente cero.
El flujo automatizado
Lo que ocurre cada vez que publico algo nuevo. Desde el commit hasta el crawler del LLM.
generate-llms.py lee todos los artículos, extrae título y descripción, regenera llms.txt.generate-sitemap.py regenera sitemap.xml con todas las URLs y fechas correctas.El mantenimiento ongoing de este sistema es prácticamente cero. Cada artículo nuevo nace ya optimizado. No hay lista de tareas pendientes que se acumule y se olvide.
Lo que ocurre automáticamente con cada publicación
El llms.txt siempre refleja el estado real del sitio. El sitemap siempre tiene las fechas correctas. Cada artículo nuevo tiene los cuatro bloques de schema.org desde el primer commit. Los crawlers de IA, en su próximo ciclo, encuentran todo en orden.
Sin este paso, la estrategia se deteriora sola. Con él, se refuerza con cada publicación.
Las señales a observar y los plazos reales
Sin promesas. Sin métricas inventadas. Lo que dice la lógica del sistema.
Los LLMs no se actualizan en tiempo real. El entrenamiento tiene ciclos. Es un juego de medio-largo plazo, exactamente como el SEO. Quien espera citas en LLMs en dos semanas se frustra y abandona. Quien entiende que es infraestructura actúa ahora y recoge la ventaja en 6-12 meses.
Pero hay señales intermedias que aparecen antes y confirman que la infraestructura funciona.
Rich results en Google Search Console
Google activa los bloques de preguntas/respuestas destacadas (FAQ snippets) antes de que los LLMs procesen el contenido. Es la señal más rápida y confirma que los schemas están bien implementados.
Dónde verlo: Google Search Console → Experiencia en la página → Rich results.
Calidad del tráfico
Antes que las citas directas, el tráfico que llega cambia de perfil. Visitantes más cualificados, mayor tiempo en página, menor tasa de rebote. Indican que el contenido está respondiendo mejor a búsquedas con intención real.
Dónde verlo: Analytics — comportamiento de sesión, páginas por visita, tiempo medio.
Citas directas en LLMs
La señal más tardía y más valiosa. Preguntar directamente a ChatGPT, Perplexity y Claude sobre tu área de expertise en tu mercado y ver si apareces citada.
Depende de los ciclos de actualización de cada modelo. No hay atajos. Hay infraestructura bien construida y paciencia.
Lo que viene ahora — seguimiento y mejora continua
La infraestructura está. Ahora toca medir, iterar y mantener.
La implementación está hecha. llms.txt, schemas en todos los artículos, URLs limpias, robots.txt abierto, pipeline automatizado. Eso es la base.
Lo que viene ahora es el trabajo de observación y mejora continua. Sin esto, la infraestructura existe pero no sabes si funciona ni dónde afinar. La diferencia entre quien lo mide y quien lo deja correr se acumula rápido.
Las herramientas de seguimiento
Google Search Console
La primera parada siempre. Valida que los rich results de FAQ se están activando, detecta errores de indexación y muestra qué queries reales traen tráfico. Gratuito. Imprescindible.
Google Rich Results Test + Schema Markup Validator
Antes de esperar semanas a que Google procese los schemas, estos dos validadores confirman en segundos que el JSON-LD está bien construido y no tiene errores.
search.google.com/test/rich-results — validación desde la perspectiva de Google.
validator.schema.org — validación técnica pura del estándar.
Perplexity · ChatGPT · Claude — test manual directo
La señal más directa de visibilidad en LLMs es preguntar directamente. Preguntas como "quién es especialista en agentes de voz IA en España" o "recomiéndame a alguien para automatización con IA en España". Si apareces, la infraestructura está funcionando.
Perplexity tiene búsqueda en tiempo real — es el más rápido en reflejar cambios recientes. ChatGPT y Claude dependen de sus ciclos de entrenamiento pero también tienen búsqueda web activable.
Screaming Frog
Crawl completo de tu propia web para detectar problemas técnicos: canonicals rotos, redirects mal configurados, páginas huérfanas, titles duplicados. Gratuito hasta 500 URLs.
Ahrefs o Semrush
Para seguimiento de posicionamiento SEO clásico en paralelo — rankings, backlinks, autoridad de dominio. No son gratuitos, pero son el estándar del sector cuando quieres datos fiables a escala.
Cadencia recomendada
- Semanal: revisar GSC, lanzar las preguntas test en Perplexity y ChatGPT, comprobar si hay nuevas citas.
- Mensual: Screaming Frog completo, revisar rich results activados, analizar cambios en tráfico.
- Trimestral: análisis profundo de tráfico, evaluar si el perfil del visitante cambió, ajustar preguntas de FAQPage según las queries reales que llegan.
¿Puede cualquier web hacer esto?
Sí. Los principios son universales. Solo cambia cómo se implementa.
Lo que hice aquí es aplicable a cualquier web, con cualquier tecnología. WordPress, Webflow, Wix, HTML puro — los principios son exactamente los mismos. Lo que cambia es cómo se implementa técnicamente.
Si tienes muchas páginas, la automatización no es opcional
Con más de 20 páginas, hacerlo manualmente es inviable. Un script que procese todos los artículos de una vez y añada los schemas es la diferencia entre hacerlo y no hacerlo. Claude Code lo resolvió en minutos lo que habrían sido días de trabajo mecánico.