Cómo hacer investigación de palabras clave para búsqueda

La mayoría de los especialistas en marketing que leen "investigación de palabras clave con IA" no saben por dónde empezar. La categoría tiene dos años. La terminología no está consolidada (AEO, GEO, optimización para búsqueda con IA, LLMO, lo mismo, cuatro nombres). El espacio de herramientas está fragmentado, ningún producto único cubre el flujo de trabajo completo, de la manera que Ahrefs o Semrush cubren la investigación tradicional. El resultado es mucho "debería estar haciendo esto" y poco "esto es lo que estoy haciendo el martes por la mañana".

Punto clave: la investigación de palabras clave con IA es un flujo de trabajo de 7 pasos: recopilar preguntas reales, agruparlas, calificarlas, comparar los motores de búsqueda y escribir resúmenes enfocados en respuestas que generen citas.AI search keyword research is a 7-step workflow: harvest real questions, cluster them, score them, benchmark the engines, and write answer-first briefs that earn citations.

Aquí está el playbook concreto. Siete pasos, ejecutados en orden, usando principalmente herramientas que ya existen. La inversión total de tiempo para un tema es de dos a cuatro horas la primera vez que lo ejecutas, bajando a veinte minutos por tema una vez que hayas desarrollado la memoria muscular. Costo en cuotas de API: $0.20-0.50 por tema si usas fuentes de pago, $0 si te atenés a las gratuitas.

Esta es la versión que produce un brief de contenido al final. No "10 preguntas sobre las que escribir", un brief real con estructura H2, puntos de datos que merecen cita, tipo de schema, y el resultado de cita predicho.

Paso 1, Elige la semilla, no la palabra clave

La investigación de palabras clave tradicional comienza con una palabra clave. La investigación de palabras clave para búsqueda con IA comienza con un tema, generalmente una frase de 3 a 5 palabras que captura una preocupación real del cliente. "zapatos para correr para pies planos", no "mejores zapatos para correr pies planos 2026". La semilla debe ser específica como para tener una respuesta, y lo suficientemente amplia como para tener múltiples subpreguntas.

Las semillas que funcionan mejor son momentos del viaje del comprador. "Elegir entre WordPress y Webflow", "migrar un sitio de 50k páginas sin perder SEO", "qué buscar en un proveedor mayorista de joyas". Adyacentes a preguntas, adyacentes a decisiones. No palabras clave únicas, no marcas.WordPress and Webflow", "moving a 50k-page site without losing SEO", "what to look for in a wholesale jewelry supplier". Question-adjacent, decision-adjacent. Not single-keyword, not branded.

Paso 2, Recopila preguntas de cinco fuentes en paralelo

Cinco lugares, en orden de relación señal-ruido.

DataForSEO People Also Ask + autosuggest. La señal canónica de Google de "preguntas reales". Costo: aproximadamente $0.05 por una expansión de semilla. Alternativa gratuita: nivel gratuito de AlsoAsked (3 búsquedas/día).

Búsqueda en Reddit a través de la API de Reddit. Gratuito, profundamente útil para preguntas de comprador en su forma natural. Busca en los subreddits que coincidan con tu tema, r/SEO, r/marketing, r/buildapcsales, etc. Los 30 hilos principales por votación, últimos 12 meses.

API de Stack Exchange. Gratuito, mejor para temas técnicos o how-to. Filtra por threads con respuesta aceptada para ver las preguntas que la gente realmente logró que le respondieran.

Quora, manual o mediante extracción de SERP. La calidad ha caído desde 2020 pero sigue siendo útil para temas B2C y de estilo de vida. SerpAPI cuesta $20/mes de entrada.

Búsqueda semántica de Tavily o Claude con web_search. Expone preguntas en artículos de forma larga, podcasts, descripciones de YouTube que el PAA estructurado se pierde. Costo: $0.005-0.01 por búsqueda.

Combina los cinco outputs en una lista. Espera 80-150 preguntas sin procesar para una semilla típica.

Paso 3, Agrupa con un LLM, no a mano

Una lista de 100 preguntas es inaccionable. Necesitas 8-15 grupos de preguntas donde cada grupo representa un subtema distinto. Hacerlo a mano toma una hora y es inconsistente. Hacerlo con Claude o GPT-4 toma 30 segundos y es más consistente.

La plantilla de prompt que funciona: "Agrupa las siguientes 120 preguntas sobre [tema] en 8-15 clusters semánticos. Para cada cluster, asígnale una etiqueta corta, lista las preguntas que lo componen e identifica la pregunta canónica que mejor resume el cluster." Canaliza el resultado a una tabla de markdown o Google Sheet.

Costo: aproximadamente $0.02 en llamadas a la API de Claude por tema.

Paso 4, Puntúa cada agrupación con tres números

Para cada pregunta canónica (una por cluster), extrae tres métricas de DataForSEO.

Volumen de búsqueda, cuántas búsquedas mensuales obtiene la pregunta canónica. Las categorías por debajo de 50 aún vale la pena cubrirlas si se agrupan alrededor de momentos de decisión de compra; las categorías por encima de 1000 vale la pena priorizarlas.

Dificultad de palabra clave (KD), puntuación equivalente a Ahrefs/Semrush de 0-100. Por debajo de 30 es realista para sitios con DR-15; 30-50 es alcanzable en 6-12 meses de construcción de autoridad; por encima de 50 es difícil para sitios que no sean empresariales.

Presencia en AI Overview, sí o no, actualmente apareciendo en Google AI Overview para esa pregunta. DataForSEO devuelve esto directamente. Las preguntas marcadas como "sí" tienen mayor prioridad porque es donde la IA está interceptando tráfico.

Paso 5, Consultar los motores de IA para los 10 clústeres principales

Para tus 10 clusters principales por puntuación combinada, consulta cada motor de IA y captura la respuesta más las fuentes citadas.

ChatGPT, más fácil a través de la API de OpenAI con GPT-4o-mini. Costo: aproximadamente $0.001 por consulta. Devuelve la respuesta; tienes que inferir las fuentes citadas del texto (a menudo imperfecto).

Perplexity, las citas de fuente más limpias. Usa la API de Perplexity. Costo: aproximadamente $0.005 por consulta. Devuelve respuesta más una lista de URLs citadas sin necesidad de inferencia.

Claude con web_search, API de Anthropic con la herramienta web_search habilitada. Costo: aproximadamente $0.01 por consulta. Devuelve respuesta más citas de fuentes en línea. Particularmente bueno para identificar fuentes recientes y técnicas.

Google AI Overview, DataForSEO lo captura en sus respuestas SERP. Sin costo adicional más allá de la consulta SERP.

Para cada uno de los cuatro motores, guarda el texto de la respuesta y los dominios citados.

Paso 6, Construir la matriz de brecha de citas

Ahora tienes, para cada clúster en los top 10, cuatro respuestas de motor IA y cuatro listas de dominios citados. Combínalas en una matriz.

Filas: clústeres. Columnas: dominios citados en los cuatro motores. Valores: cantidad de citas en los cuatro motores.

Ordena las columnas por cantidad total de citas en orden descendente. Las 10 columnas principales son los dominios que actualmente ganan visibilidad en búsqueda IA para tu tema. Si tu dominio no está en los 10 principales, esa es tu brecha competitiva.

Para cada clúster, identifica el dominio que tiene el mayor número de citas y lee la página desde la que se está citando. Los patrones que encuentres, estructura H2, densidad de citas, uso de schema, los puntos de datos específicos siendo citados, se convierten en la plantilla para tu propio contenido.

Paso 7, Generar el resumen de contenido

Para cada uno de los 5-10 clusters principales por puntuación, produce un resumen de contenido que incluya: título de página, URL slug, palabra clave principal, palabras clave secundarias, conteo de palabras objetivo, estructura H2 (un H2 por sub-pregunta en el cluster), puntos de datos dignos de cita para incluir, tipo de schema markup, enlaces internos a añadir, y un resultado de cita predicho (a qué motores de IA está dirigido este contenido).

Los resúmenes generados por LLM ahorran 30-60 minutos por resumen comparado con los escritos a mano. La plantilla de prompt correcta especifica la estructura anterior explícitamente.

Cómo se ve el flujo de trabajo en la práctica

En la práctica, los 7 pasos corren así: 30 minutos de recopilación (llamadas API paralelas), 10 minutos de clustering (LLM), 20 minutos de puntuación (endpoints bulk de DataForSEO), 30 minutos consultando motores (paralelo), 30 minutos de análisis de brecha de citas (trabajo de matriz), 60 minutos de generación de resumen (asistido por LLM). Tres horas para un tema la primera vez. Veinte minutos por tema en la décima vez.

O, si no deseas ejecutar todo manualmente, la herramienta gratuita en /tools/ai-search-keyword-research/ ejecuta los pasos 1-6 en 30 segundos end-to-end y produce la salida de resumen que necesita el paso 7. La herramienta se alimenta de las mismas APIs (DataForSEO, Reddit, Perplexity, Claude) bajo el capó.

Preguntas frecuentes

¿Puedo hacer investigación de palabras clave de búsqueda por IA solo con herramientas gratuitas?

Mayormente sí, parcialmente no. El stack gratuito es: AlsoAsked tier gratuito + Reddit API + Stack Exchange API + ChatGPT tier gratuito (consultas manuales) + Perplexity tier gratuito (consultas manuales). Pierdes tres cosas: volumen de búsqueda de DataForSEO + KD por pregunta, consultas programáticas de Perplexity/Claude (manual es más lento), y automatización de generación de resumen. Para cinco temas, el stack gratuito está bien. Para investigación continua a escala, las APIs pagadas ahorran horas.

¿Qué tan frecuentemente debería actualizar la investigación de palabras clave de búsqueda por IA para un tema?

La recuperación del motor de IA cambia más rápido que los SERPs de Google. Para temas activos, actualiza cada 4-8 semanas. Para temas perennes, cada 90 días. La señal que dispara una actualización es cuando la respuesta de AI Overview para tu cluster principal cambia significativamente, eso significa que los motores han actualizado su conjunto de recuperación.

¿Debo hacer investigación de palabras clave de búsqueda con IA antes o después de la investigación tradicional de SEO?

En paralelo. Los dos flujos de trabajo comparten fuentes de datos (DataForSEO, autosuggest) y se pueden ejecutar como un proceso combinado. La mayoría de los equipos que hacen ambas cosas en momentos separados duplican el trabajo; el flujo de trabajo integrado es el estado futuro.

¿Cómo se ve un brief de contenido al final de esto?

Tres páginas, estructuradas. Página 1: metadatos, título, slug, palabras clave primarias/secundarias, número de palabras objetivo. Página 2: estructura, esquema H2 con un H2 por subpregunta, H3s sugeridos, puntos de datos dignos de cita para incluir, entidades nombradas, tipo de schema. Página 3: estrategia de citación, qué motores de IA es el contenido dirigido, qué patrones de competidores está tomando prestados, resultado de citación predicho.

¿Cuál es el mayor error que cometen los equipos haciendo esto?

Tratarlo como un ejercicio de palabras clave. El resultado no es una lista de palabras clave. El resultado es una lista de briefs de contenido que tienen resultados de citación predichos, escritos para extracción de pasajes, estructurados para recuperación. Los equipos que producen listas de palabras clave al final de este flujo de trabajo han completado un tercio del trabajo.

Qué hacer a continuación

Si quieres primero la explicación de contexto más amplio, lee el post pilar sobre investigación de palabras clave de búsqueda con IA en 2026.

Si quieres ejecutar el flujo de trabajo en tu propio tema, la herramienta gratuita en /tools/ai-search-keyword-research/ ejecuta los 7 pasos en aproximadamente 30 segundos.

Si quieres la comparación entre investigación de palabras clave AEO, GEO y SEO tradicional como disciplinas, ese es el siguiente artículo en este conjunto.

O agenda una llamada de 30 minutos si quieres hablar sobre cómo se ve esto aplicado a tu brief específico.

Pick your view

Cómo hacer investigación de palabras clave para búsqueda con IA: el playbook de 7 pasos para 2026