El blog de DataForSEO tiene una pieza útil sobre combinar sus endpoints con APIs de NLP para automatizar workflows de contenido SEO. La superficie de API que describen es real. La versión que sobrevive un cron de lunes 09:00 UTC — caché, límites de velocidad, puertas de despliegue, repetición de errores, límites de costo — se ve significativamente diferente de la demostración.
Este sitio ejecuta la versión de producción. El dashboard /admin/llm-mentions/ extrae payloads reales de ai_optimization de DataForSEO en un cron semanal. El /tools/ai-citation-checker/ expone un verificador SERP + AI Overview de DataForSEO gratuito al tráfico público con limitación de velocidad por IP. El barrido de Lighthouse de 47 URLs que se ejecuta cada lunes en seo_pages cuesta $0.30 y reemplaza una suscripción de PageSpeed Insights de $40/mes. Todo el pipeline fue construido en Claude Code en cuatro sesiones de trabajo.
Así se ve realmente esa pila, y dónde decides qué automatizar versus qué mantener humano.
Los cinco endpoints de DataForSEO que vale la pena encadenar
La mayoría de la automatización SEO que funciona en producción usa alguna combinación de estos cinco. No todos a la vez — elegís según el caso de uso.
- /v3/serp/google/organic/live/advanced — los 10 resultados orgánicos principales actuales para una palabra clave + detección de AI Overview. La columna vertebral de cualquier rastreador de citas.
- /v3/on_page/lighthouse/live/json — auditoría completa de Lighthouse (Perf / A11y / BP / SEO + Core Web Vitals). Cuesta ~$0,005 por URL. Reemplaza PageSpeed Insights para cualquier análisis por encima de ~20 URLs/mes.
- /v3/on_page/instant_pages — análisis de on-page a nivel de página (longitud de título, descripción, tipos de schema, conteos de enlaces internos/externos, etiquetas deprecadas, puntuaciones de consistencia de contenido). $0,001/URL. El endpoint más económico para evaluar la salud del contenido.
- /v3/ai_optimization/{engine}/llm_responses/live — consulta ChatGPT / Perplexity / Gemini directamente con búsqueda web habilitada, obtén el texto de respuesta más la lista de citas. ~$0,03/ejecución. El endpoint que potencia el rastreo real de visibilidad en búsqueda por IA.
- /v3/dataforseo_labs/google/keyword_overview — volumen de búsqueda, KD, clasificación de intención, tendencia mensual. La columna vertebral de datos de palabras clave. Económica a $0,001 por palabra clave.
La parte de Claude Code — lo que el modelo realmente hace
El valor de Claude Code en este stack no está en la llamada API en sí. La llamada es un fetch con encabezados de autenticación; cualquier ingeniero junior puede escribirla. El valor está en cuatro lugares.
1. Análisis de schema
Las respuestas de DataForSEO están profundamente anidadas. /v3/on_page/lighthouse/live/json devuelve categorías en tasks[0].result[0].categories — no en items[0].categories donde esperarías. /v3/ai_optimization/.../llm_responses/live devuelve texto dentro de result.items[].sections[].text, dos niveles más profundo que las APIs de IA típicas. Gemini envuelve cada URL de cita en vertexaisearch.cloud.google.com/grounding-api-redirect/<token>, así que el dominio fuente real está en el título de la cita, no en el campo URL. Claude Code lee la forma real de respuesta en una prueba de humo, depura el desajuste, corrige el analizador. La habilidad 'verificación-antes-de-completar' se niega a declarar hecho hasta que una respuesta real se analiza correctamente.
2. Disciplina de Cron + caché
Los costos de DataForSEO se suman. El rastreador de LLM mencionado aquí cuesta $0,03 por ejecución × 30 prompts × 4 ejecuciones/mes = $10-12/mes. Funciona porque es semanal. Ejecútalo cada hora y el costo es 168x. El patrón que sobrevive: escrituras impulsadas por cron a Supabase, lecturas públicas desde caché, actualización manual forzada detrás de una compuerta JWT. La capa de hook de Claude Code lo hace cumplir — la pre-confirmación se niega a enviar código que llame a un endpoint de pago sin encabezados de límite de velocidad + caché.
3. Compuertas de despliegue
Una función programada se ejecuta solo en production main. Entonces un rastreador que escribe en seo_llm_runs cada lunes necesita estar fusionado antes del lunes. La disciplina de entrega de sesiones de Claude Code lo detecta. El documento HANDOFF de ayer literalmente dice "El cron de lunes 09:00 UTC se ejecuta solo una vez que esto se despliega en production Netlify" — la compuerta de fusión está documentada y reforzada antes de cerrar el trabajo.
4. Reproducción de errores
DataForSEO devuelve HTTP 200 con status_code: 40402 dentro del cuerpo JSON cuando una tarea falla. Un fetch().then(r => r.json()) ingenuo cree que tuvo éxito. El código en producción lee el status_code interno, reintenta en 4xx, registra el contenedor de tarea sin procesar en una tabla de depuración para análisis forense. La habilidad de depuración sistemática de Claude Code refuerza la depuración impulsada por hipótesis cuando esto falla — escribe la hipótesis, diseña la prueba mínima, estrecha más. El script de humo (scripts/smoke-llm-mentions.mjs en este sitio) fue el artefacto que sacó a la luz el error de envolvimiento de URL de Gemini antes de que el cron completo quemara $5 de gasto en API.
El flujo de contenido de cinco pasos, en forma de producción
El artículo de DataForSEO describe una cadena de generación de contenido: SERP → resumen de IA → subtemas → generación de texto. Aquí está lo que la misma cadena se ve como con la disciplina de producción aplicada.
Paso 1. Obtención de SERP con caché
POST /v3/serp/google/organic/live/advanced para la palabra clave objetivo. Almacena los 10 resultados principales en Supabase con TTL de 7 días. Cada resumen posterior sobre la misma palabra clave lee desde caché. Ahorra 95% del gasto en API en la cola larga (la mayoría de consultas se agrupan alrededor de las mismas palabras clave).
Paso 2. Resumen de IA con almacenamiento en caché de indicaciones
Canaliza las 10 URLs de resultados principales a Anthropic Claude (Sonnet 4.6, almacenado en caché de indicaciones en el mensaje del sistema). El resumen pregunta "¿cuáles son los temas comunes en estos resultados? ¿Qué entidades se citan universalmente?" Salida: un resumen de patrón común de 400 palabras. El almacenamiento en caché de indicaciones de Anthropic reduce el costo 75% en palabras clave repetidas.
Paso 3. Mapa de cobertura de entidades
POST /v3/content_analysis/search con la palabra clave objetivo. Devuelve menciones de marca/producto en el contenido mejor posicionado con puntuaciones de sentimiento. Resultado: una lista de entidades que tu borrador debe mencionar para verse completo. Omite este paso si la palabra clave es genérica — solo vale la pena para consultas con intención de compra (intent comercial).
Paso 4. Estructura de subtemas
Usa Anthropic para convertir el resumen SERP + mapa de entidades en una estructura H2/H3 propuesta. De seis a nueve H2s, cada uno con tres a cinco H3s candidatos. Resultado: un esquema Markdown listo para revisión humana. El humano controla este paso — sin automatización total. La habilidad 'requesting-code-review' aplica también al contenido.
Paso 5. Generación de borrador, RDA Humaniser, ingesta
Claude (Sonnet 4.6 para volumen, Opus 4.7 para flagship) escribe el borrador contra el esquema aprobado. El resultado pasa por el filtro RDA Humaniser — elimina indicios de IA, rompe el ritmo de oración uniforme, varía la extensión de cláusulas. Luego ingesta en Supabase como status='ready'. Una segunda revisión humana aprueba antes de que el status cambie a 'published'.
Números reales de la tubería de producción en este sitio
El /tools/ai-citation-checker/ usa una versión simplificada de esta misma cadena. Números en vivo de mayo de 2026:
- Llamada SERP de DataForSEO: 5 consultas × $0.001 = $0.005 por verificación de cita
- Síntesis Anthropic Claude: ~$0.02 por verificación (Sonnet 4.6, con prompt-cached)
- Costo efectivo por uso de herramienta pública: ~$0,03
- Límite de velocidad: 3 verificaciones nuevas por IP por hora; resultados en caché ilimitados
- Peor caso diario: ~$15 con saturación completa en todas las IPs
- Gasto diario real después del caché: ~$0,80 (las consultas en caché representan el 90%+ del tráfico en búsquedas de marcas populares)
Qué automatizar, qué mantener manual
Automatizar
- Obtención de SERP, caché, monitoreo
- Auditorías Lighthouse + salud de página a escala
- Seguimiento de citas de LLM en ChatGPT, Perplexity, Gemini
- Validación de Schema + meta + hreflang
- Andamiaje de brief de contenido (esquema + mapa de cobertura de entidades)
- Generación de borrador de primer pase para high-volume long tail (ej. páginas de códigos de estado, páginas de ubicación)
Mantén lo humano
- Aprobación de esquema antes de generar el borrador — la automatización sin esta puerta produce contenido genérico a escala
- Revisión final antes de publicar — cada post insignia
- Estrategia de autoridad temática — qué cluster construir, qué saltarse
- Llamadas de descubrimiento y alcance — las señales del comprador que lees en una llamada de 30 minutos no se transfieren a flujos de trabajo automatizados
- Diagnóstico de penalización y recuperación — las anomalías de Google Search Console necesitan una coincidencia de patrones humana contra sitios anteriores
Dónde se detiene el artículo de DataForSEO y dónde comienza la producción
El artículo de DataForSEO muestra la superficie de la API y una demostración de ruta feliz. La capa de producción es todo lo que se sitúa entre esa demostración y un sitio que realmente se posiciona: la estrategia de caché, el cronograma de cron, la puerta JWT en force-refresh, los hooks que bloquean escrituras directas en prod, las pruebas de humo que verifican la forma de respuesta antes de quemar gasto en API, los reintentos de escritura en Supabase, las puertas de despliegue, la reproducción de errores. Ninguno de esos se envía en la demostración porque son problemas de infraestructura, no problemas de API.
Si quieres la superficie de la API, la documentación de DataForSEO está bien escrita. Si quieres la capa de producción conectada a tu codebase, estamos hablando de cuatro a seis semanas de trabajo para una configuración de dominio único, más tiempo si quieres soporte multi-dominio o multi-locale. Claude Code reduce eso a dos o tres semanas a tarifa senior. Ese es el engagement que ofrezco.
El engagement
Tres formas de proyecto disponibles. Build feature: una superficie de automatización específica (citation tracker, content brief generator, Lighthouse sweep), 1-2 semanas, £5k-£15k. Build product surface: sitio de marketing + admin dashboard + content pipeline + automation hooks, 4-8 semanas, £15k-£45k. Build platform: stack completo de SEO automation con multi-dominio, multi-locale, integraciones personalizadas, 12-20 semanas, £45k-£150k.
Discovery es una semana paga. El output es una especificación técnica escrita, un presupuesto de precio fijo, y una smoke test funcional que prueba que la combinación DataForSEO + Anthropic funciona contra tu codebase específico antes de la construcción completa. Agenda una llamada de 30 minutos para empezar.