La mayoría de los especialistas en marketing que leen "investigación de palabras clave para búsqueda con IA" no saben por dónde empezar. La categoría tiene dos años. La terminología no está establecida (AEO, GEO, AI search optimisation, LLMO — lo mismo, cuatro nombres). El espacio de herramientas está fragmentado — ningún producto único cubre el flujo de trabajo completo, como lo hacen Ahrefs o Semrush para la investigación tradicional. El resultado es mucho "debería estar haciendo esto" y poco "esto es lo que estoy haciendo el martes por la mañana".
Aquí está el playbook concreto. Siete pasos, ejecutados en orden, usando principalmente herramientas que ya existen. La inversión total de tiempo para un tema es de dos a cuatro horas la primera vez que lo ejecutas, bajando a veinte minutos por tema una vez que hayas desarrollado la memoria muscular. Costo en cuotas de API: $0.20-0.50 por tema si usas fuentes de pago, $0 si te atenés a las gratuitas.
Esta es la versión que produce un briefing de contenido al final. No "10 preguntas sobre las que escribir" — un brief real con estructura H2, puntos de datos dignos de citación, tipo de schema, y el resultado de citación predicho.
Paso 1 — Elige la semilla, no la palabra clave
La investigación tradicional de palabras clave comienza con una palabra clave. La investigación de palabras clave para búsqueda con IA comienza con un tema — generalmente una frase de 3-5 palabras que captura una preocupación real del cliente. "zapatillas para correr con pies planos", no "mejores zapatillas para pies planos 2026". La semilla debe ser lo suficientemente específica para tener una respuesta, lo suficientemente amplia para tener múltiples subpreguntas.
Las semillas que funcionan mejor son momentos del viaje del comprador. "Elegir entre WordPress y Webflow", "migrar un sitio de 50k páginas sin perder SEO", "qué buscar en un proveedor mayorista de joyas". Adyacentes a preguntas, adyacentes a decisiones. No palabras clave únicas, no marcas.
Paso 2 — Cosecha preguntas de cinco fuentes en paralelo
Cinco lugares, en orden de relación señal-ruido.
DataForSEO People Also Ask + autosuggest. La señal canónica de Google de "preguntas reales". Costo: aproximadamente $0.05 por una expansión de semilla. Alternativa gratuita: nivel gratuito de AlsoAsked (3 búsquedas/día).
Búsqueda en Reddit a través de la API de Reddit. Gratuito, profundamente útil para preguntas de comprador en su forma natural. Busca en los subreddits que coincidan con tu tema — r/SEO, r/marketing, r/buildapcsales, etc. Top 30 threads por upvotes, últimos 12 meses.
API de Stack Exchange. Gratuito, mejor para temas técnicos o how-to. Filtra por threads con respuesta aceptada para ver las preguntas que la gente realmente logró que le respondieran.
Quora — manual o mediante scrape de SERP. La calidad ha bajado desde 2020 pero sigue siendo útil para temas B2C y lifestyle. SerpAPI cuesta $20/mes de entrada.
Búsqueda semántica de Tavily o Claude con web_search. Expone preguntas en artículos de forma larga, podcasts, descripciones de YouTube que el PAA estructurado se pierde. Costo: $0.005-0.01 por búsqueda.
Combina los cinco outputs en una lista. Espera 80-150 preguntas sin procesar para una semilla típica.
Paso 3 — Agrupa con un LLM, no a mano
Una lista de 100 preguntas es inaccionable. Necesitas 8-15 grupos de preguntas donde cada grupo representa un subtema distinto. Hacerlo a mano toma una hora y es inconsistente. Hacerlo con Claude o GPT-4 toma 30 segundos y es más consistente.
La plantilla de prompt que funciona: "Agrupa las siguientes 120 preguntas sobre [tema] en 8-15 clusters semánticos. Para cada cluster, asígnale una etiqueta corta, lista las preguntas que lo componen e identifica la pregunta canónica que mejor resume el cluster." Canaliza el resultado a una tabla de markdown o Google Sheet.
Costo: aproximadamente $0.02 en llamadas a la API de Claude por tema.
Paso 4 — Califica cada cluster con tres números
Para cada pregunta canónica (una por cluster), extrae tres métricas de DataForSEO.
Volumen de búsqueda — cuántas búsquedas mensuales recibe la pregunta canónica. Categorías por debajo de 50 aún valen la pena cubrir si se agrupan alrededor de momentos de decisión de compra; categorías por encima de 1000 son prioritarias.
Dificultad de palabra clave (KD) — puntuación equivalente a Ahrefs/Semrush de 0-100. Por debajo de 30 es realista para sitios con DR-15; 30-50 es alcanzable en 6-12 meses de construcción de autoridad; por encima de 50 es difícil para sitios que no son de empresa.
Presencia de AI Overview — sí o no, actualmente apareciendo en Google AI Overview para esa pregunta. DataForSEO devuelve esto directamente. Las preguntas marcadas con "sí" son más prioritarias porque ahí es donde la IA intercepta el tráfico.
Paso 5 — Consulta los motores de IA para los 10 clusters principales
Para tus 10 clusters principales por puntuación combinada, consulta cada motor de IA y captura la respuesta más las fuentes citadas.
ChatGPT — lo más fácil es usar la API de OpenAI con GPT-4o-mini. Costo: aproximadamente $0.001 por consulta. Devuelve la respuesta; tienes que inferir las fuentes citadas del texto (a menudo imperfecto).
Perplexity — las citas de fuente más limpias. Usa la API de Perplexity. Costo: aproximadamente $0.005 por consulta. Devuelve respuesta más una lista de URLs citadas sin necesidad de inferencia.
Claude con web_search — API de Anthropic con la herramienta web_search habilitada. Costo: aproximadamente $0.01 por consulta. Devuelve respuesta más citas de fuente en línea. Particularmente bueno para surfear fuentes recientes y técnicas.
Google AI Overview — DataForSEO lo captura en sus respuestas SERP. Sin costo adicional más allá de la consulta SERP.
Para cada uno de los cuatro motores, guarda el texto de la respuesta y los dominios citados.
Paso 6 — Construye la matriz de brecha de citas
Ahora tienes, para cada clúster en los top 10, cuatro respuestas de motor IA y cuatro listas de dominios citados. Combínalas en una matriz.
Filas: clústeres. Columnas: dominios citados en los cuatro motores. Valores: cantidad de citas en los cuatro motores.
Ordena las columnas por cantidad total de citas en orden descendente. Las 10 columnas principales son los dominios que actualmente ganan visibilidad en búsqueda IA para tu tema. Si tu dominio no está en los 10 principales, esa es tu brecha competitiva.
Para cada clúster, identifica el dominio que tiene la mayor cantidad de citas y lee la página desde la que está siendo citado. Los patrones que encuentres — estructura H2, densidad de citas, uso de schema, los puntos de datos específicos que están siendo citados — se convierten en la plantilla para tu propio contenido.
Paso 7 — Generar el resumen de contenido
Para cada uno de los 5-10 clusters principales por puntuación, produce un resumen de contenido que incluya: título de página, URL slug, palabra clave principal, palabras clave secundarias, conteo de palabras objetivo, estructura H2 (un H2 por sub-pregunta en el cluster), puntos de datos dignos de cita para incluir, tipo de schema markup, enlaces internos a añadir, y un resultado de cita predicho (a qué motores de IA está dirigido este contenido).
Los resúmenes generados por LLM ahorran 30-60 minutos por resumen comparado con los escritos a mano. La plantilla de prompt correcta especifica la estructura anterior explícitamente.
Cómo se ve el flujo de trabajo en la práctica
En la práctica, los 7 pasos corren así: 30 minutos de recopilación (llamadas API paralelas), 10 minutos de clustering (LLM), 20 minutos de puntuación (endpoints bulk de DataForSEO), 30 minutos consultando motores (paralelo), 30 minutos de análisis de brecha de citas (trabajo de matriz), 60 minutos de generación de resumen (asistido por LLM). Tres horas para un tema la primera vez. Veinte minutos por tema en la décima vez.
O, si no deseas ejecutar todo manualmente, la herramienta gratuita en /tools/ai-search-keyword-research/ ejecuta los pasos 1-6 en 30 segundos end-to-end y produce la salida de resumen que necesita el paso 7. La herramienta se alimenta de las mismas APIs (DataForSEO, Reddit, Perplexity, Claude) bajo el capó.
Preguntas frecuentes
¿Puedo hacer investigación de palabras clave de búsqueda por IA solo con herramientas gratuitas?
Mayormente sí, parcialmente no. El stack gratuito es: AlsoAsked tier gratuito + Reddit API + Stack Exchange API + ChatGPT tier gratuito (consultas manuales) + Perplexity tier gratuito (consultas manuales). Pierdes tres cosas: volumen de búsqueda de DataForSEO + KD por pregunta, consultas programáticas de Perplexity/Claude (manual es más lento), y automatización de generación de resumen. Para cinco temas, el stack gratuito está bien. Para investigación continua a escala, las APIs pagadas ahorran horas.
¿Qué tan frecuentemente debería actualizar la investigación de palabras clave de búsqueda por IA para un tema?
La recuperación del motor de IA cambia más rápido que los SERPs de Google. Para temas activos, actualiza cada 4-8 semanas. Para temas perennes, cada 90 días. La señal que dispara una actualización es cuando la respuesta de AI Overview para tu cluster principal cambia significativamente — eso significa que los motores han actualizado su conjunto de recuperación.
¿Debo hacer investigación de palabras clave de búsqueda con IA antes o después de la investigación tradicional de SEO?
En paralelo. Los dos flujos de trabajo comparten fuentes de datos (DataForSEO, autosuggest) y se pueden ejecutar como un proceso combinado. La mayoría de los equipos que hacen ambas cosas en momentos separados duplican el trabajo; el flujo de trabajo integrado es el estado futuro.
¿Cómo se ve un brief de contenido al final de esto?
Tres páginas, estructuradas. Página 1: meta — título, slug, palabras clave primarias/secundarias, conteo de palabras objetivo. Página 2: estructura — esquema de nivel H2 con un H2 por subpregunta, H3 sugeridos, puntos de datos dignos de citación para incluir, entidades nombradas, tipo de schema. Página 3: estrategia de citación — en cuáles motores de IA se dirige este contenido, qué patrones de competidores toma prestado, resultado de citación predicho.
¿Cuál es el mayor error que cometen los equipos haciendo esto?
Tratarlo como un ejercicio de palabras clave. El resultado no es una lista de palabras clave. El resultado es una lista de briefs de contenido que tienen resultados de citación predichos, escritos para extracción de pasajes, estructurados para recuperación. Los equipos que producen listas de palabras clave al final de este flujo de trabajo han completado un tercio del trabajo.
Qué hacer a continuación
Si quieres primero la explicación de contexto más amplio, lee el post pilar sobre investigación de palabras clave de búsqueda con IA en 2026.
Si quieres ejecutar el flujo de trabajo en tu propio tema, la herramienta gratuita en /tools/ai-search-keyword-research/ ejecuta los 7 pasos en aproximadamente 30 segundos.
Si quieres la comparación entre investigación de palabras clave AEO, GEO y SEO tradicional como disciplinas, ese es el siguiente artículo en este conjunto.
O agenda una llamada de 30 minutos si quieres hablar sobre cómo se ve esto aplicado a tu brief específico.
