Un análisis de 1,4 millones de prompts y 25,5 millones de URLs revela los factores que determinan la visibilidad de una marca en la IA generativa
La búsqueda con IA se ha consolidado como un nuevo canal de visibilidad para las marcas. La presencia en las respuestas de modelos de lenguaje como ChatGPT es ya un campo de batalla estratégico para el marketing digital. Sin embargo, hasta ahora existían pocos datos empíricos sobre qué determina que una página sea citada o ignorada por estos sistemas.
Ahrefs, una plataforma líder de marketing digital y SEO, publica los resultados de su investigación sobre citación en ChatGPT: un estudio basado en 1,4 millones de prompts y más de 25,5 millones URLs que analiza por qué el modelo cita unas fuentes y descarta otras. La conclusión principal es contundente: de todas las páginas que ChatGPT rastrea para elaborar una respuesta, solo el 50 % acaba siendo citada como fuente.
Hallazgos principales del estudio
1. ChatGPT rastrea el doble de lo que cita
De media, ChatGPT extrae aproximadamente 16,57 URLs que termina citando y 16,58 URLs que descarta por cada prompt procesado. Esto significa que, para cada respuesta, el modelo analiza un volumen significativo de fuentes, pero solo la mitad supera el umbral de citación. Para las marcas, esto implica que ser rastreado no equivale a ser visible: la optimización del contenido es determinante.
La herramienta Brand Radar de Ahrefs permite detectar qué páginas han sido usadas por ChatGPT para generar las respuestas y cuáles finalmente ha enlazado.
2. Las URLs de tipo «búsqueda» dominan la citación
Las páginas cuya URL corresponde a un patrón de búsqueda (por ejemplo, URLs generadas por motores de búsqueda internos o directorios) alcanzan una tasa de citación del 88,46 %. Este dato sugiere que las marcas deben estar en ese grupo de selección de búsqueda y, por tanto, posicionar por su contenido para ser citadas por ChatGPT. Dentro de estos resultados se incluyen también Reddit y Youtube.
3. Reddit: rastreado masivamente pero no siempre citado
Reddit constituye el 67,8 % de todas las URLs no citadas en el estudio, pese a acumular 16,1 millones de registros. Su tasa de citación es de apenas el 1,93 %. Este hallazgo indica que, aunque ChatGPT consume grandes volúmenes de contenido generado por usuarios, no siempre lo incluye como fuente en sus respuestas.
4. La alineación semántica entre título y consulta es un factor clave
El estudio mide la similitud semántica entre el título de una página y el prompt del usuario. En las URLs citadas, la similitud media es de 0,602, frente a 0,484 en las no citadas. La diferencia se amplía aún más cuando se compara con las consultas derivadas (fan-out queries), donde la similitud sube a 0,656. En términos prácticos, las páginas cuyos títulos reflejan con precisión la intención de búsqueda del usuario tienen una probabilidad significativamente mayor de ser citadas.
5. Los slugs de la URL podrían influir en la visibilidad
Las URLs con slugs en lenguaje natural —es decir, aquellas que contienen palabras descriptivas y legibles— obtienen una tasa de citación del 89,78 %, frente al 81,11 % de las URLs sin estructura legible. Una diferencia de casi nueve puntos porcentuales que subraya la importancia del SEO técnico incluso en el contexto de la IA generativa.
Implicaciones para las marcas
Los datos del estudio apuntan a una serie de acciones concretas para mejorar la presencia en las respuestas de ChatGPT:
- Optimizar el contenido para consultas fan-out: alinear el contenido actualizado con las subconsultas generadas para cada prompt, ya que las páginas que coincidan serán citadas y las que no, ignoradas. Brand Radar incorpora datos de consultas fan-out en el informe de ChatGPT.
- Optimizar títulos para la intención del usuario: alinear semánticamente los títulos de página con las consultas más frecuentes del público objetivo.
- Estructurar URLs de forma legible: emplear slugs descriptivos y en lenguaje natural para aumentar la probabilidad de citación.
- Monitorizar la presencia en IA generativa: herramientas como Brand Radar de Ahrefs permiten rastrear cuándo y cómo una marca es mencionada por modelos de IA, facilitando una respuesta estratégica en tiempo real.
Se puede acceder al informe completo aquí.
Acerca de Ahrefs
Ahrefs es la plataforma de marketing todo en uno para mantener cualquier marca visible en buscadores, IA y la web, disponible en más de 180 países. Su suite incluye herramientas de SEO, análisis de búsqueda con IA, creación de contenido, analítica web, seguimiento de posiciones y gestión de redes sociales, todo respaldado por 15 años de datos y el rastreador web más activo del sector —el segundo del mundo, solo por detrás de Google. Con 35 billones de backlinks, 110.000 millones de keywords y 320 petabytes de datos indexados, Ahrefs es la plataforma de referencia para marketers en el 44 % de las empresas del Fortune 500.
