DataForSEO 博客有一篇关于将其端点与 NLP API 结合以自动化 SEO 内容工作流的有用文章。他们描述的 API 表面是真实的。能在周一 09:00 UTC cron 任务中存活的版本 — 缓存、速率限制、部署门、错误重放、成本上限 — 看起来与演示版本有实质性差异。
这个网站运行生产版本。/admin/llm-mentions/ 仪表板每周在 cron 任务中拉取真实的 DataForSEO ai_optimization 负载。/tools/ai-citation-checker/ 向公共流量暴露一个免费的 DataForSEO SERP + AI Overview 检查,带有 IP 速率限制。每周一运行的 47 个 URL Lighthouse 扫描成本为 $0.30,替代了 $40/月的 PageSpeed Insights 订阅。整个管道在四个工作日内用 Claude Code 构建。
以下就是该堆栈实际的样子,以及你在哪里决定自动化什么与保持人工的内容。
五个值得链接的 DataForSEO 端点
大多数在生产中经得起考验的 SEO 自动化使用这五个中的某种组合。不是全部一次 — 你按用例选择。
- /v3/serp/google/organic/live/advanced — 某个关键词的当前前 10 名有机搜索结果 + AI Overview 检测。任何引用跟踪器的支撑。
- /v3/on_page/lighthouse/live/json — 完整的 Lighthouse 审计(性能 / 无障碍 / 最佳实践 / SEO + Core Web Vitals)。每个 URL 约 $0.005。对于每月 ~20 个 URL 以上的扫描,取代 PageSpeed Insights。
- /v3/on_page/instant_pages — 页面级页面分析(标题长度、描述、schema 类型、内部/外部链接数量、已废弃标签、内容一致性评分)。$0.001/URL。最便宜的单一端点,用于内容健康状况检查。
- /v3/ai_optimization/{engine}/llm_responses/live — 直接查询 ChatGPT / Perplexity / Gemini,启用网络搜索,获取响应文本和引用列表。~$0.03/次。实际驱动 AI 搜索可见性追踪的端点。
- /v3/dataforseo_labs/google/keyword_overview — 搜索量、KD、意图分类、月度趋势。关键词数据的骨架。按 $0.001 per keyword 计价,很便宜。
Claude Code 部分 — 模型实际做的事
Claude Code 在这个堆栈中的价值不在 API 调用本身。调用就是一个带认证头的 fetch;任何初级工程师都能写。价值在四个地方。
1. Schema 解析
DataForSEO 的响应层级很深。/v3/on_page/lighthouse/live/json 的分类在 tasks[0].result[0].categories — 不是在你会猜想的 items[0].categories。/v3/ai_optimization/.../llm_responses/live 的文本在 result.items[].sections[].text,比典型 AI API 深两层。Gemini 会把每个引用 URL 都包裹在 vertexaisearch.cloud.google.com/grounding-api-redirect/<token>,所以真实的源域名在引用标题里,不在 URL 字段。Claude Code 通过烟雾测试读出实际响应形状,调试不匹配的地方,修复解析器。"验证前完成"这个技能拒绝声称完成,直到真实响应被正确解析。
2. Cron + 缓存纪律
DataForSEO 的成本会累积。这里的 LLM 提及追踪器成本 $0.03 per run × 30 个提示 × 4 runs/月 = $10-12/月。之所以可行是因为它是周度执行。如果每小时运行,成本就是 168 倍。存活下来的模式:cron 驱动写入 Supabase,从缓存公开读取,JWT 门控的手动强制刷新。Claude Code 的 hook 层强制执行这一点 — pre-commit 拒绝推送任何在没有速率限制 + 缓存头的情况下调用付费端点的代码。
3. 部署门禁
定时函数仅在生产环境主分支上执行。所以一个每周一向 seo_llm_runs 表写入数据的跟踪器必须在周一之前合并。Claude Code 的交接纪律会捕获这一点。昨天的交接文档字面上说"周一 09:00 UTC 的 cron 任务仅在代码部署到生产环境 Netlify 后才会执行"——合并门禁已记录在案并在工作关闭前被强制执行。
4. 错误回放
DataForSEO 返回 HTTP 200,在 JSON 正文中包含 status_code: 40402,当任务失败时。一个不谨慎的 fetch().then(r => r.json()) 会认为它成功了。生产代码读取内部 status_code,在 4xx 时重试,将原始任务包装记录到调试表用于取证。Claude Code 的系统化调试技能在这种情况发生时强制执行假设驱动的调试——写下假设,设计最小化测试,进一步缩小范围。烟雾测试脚本(本网站上的 scripts/smoke-llm-mentions.mjs)是在完整 cron 任务烧掉 5 美元 API 支出之前发现 Gemini URL 包装错误的工件。
五步内容工作流,生产形式
DataForSEO 文章描述了一个内容生成链:SERP → AI 摘要 → 子主题 → 文本生成。这是应用生产纪律后相同链的样子。
第 1 步。带缓存的 SERP 抓取
针对目标关键词执行 POST /v3/serp/google/organic/live/advanced。将前 10 个结果缓存到 Supabase,TTL 为 7 天。同一关键词的后续简报从缓存读取。在长尾关键词上节省 95% 的 API 支出(大多数查询围绕相同关键词聚集)。
第 2 步。带提示缓存的 AI 摘要
将前 10 个结果 URL 导入 Anthropic Claude(Sonnet 4.6,在系统消息上启用提示缓存)。摘要询问"这些结果之间的共同主题是什么?哪些实体被普遍引用?"输出:一份 400 字的共同模式简报。Anthropic 提示缓存在重复关键词上将成本降低 75%。
第 3 步。实体覆盖图
POST /v3/content_analysis/search,使用目标关键词。返回顶级排名内容中的品牌/产品提及及情感分数。输出:你的草稿必须提及的实体列表,使其看起来完整。如果关键词是通用的,请跳过此步骤——仅对买家查询(商业意图)值得进行。
第 4 步。子主题结构
使用 Anthropic 将 SERP 摘要 + 实体图转换为建议的 H2/H3 结构。6 到 9 个 H2,每个包含 3 到 5 个候选 H3。输出:准备好供人工审查的 Markdown 大纲。人工把控此步骤——不完全自动化。"请求代码审查"的技能同样适用于内容。
第 5 步。草稿生成、RDA 人性化处理、摄取
Claude(批量使用 Sonnet 4.6,旗舰级使用 Opus 4.7)按照批准的大纲编写草稿。输出通过 RDA 人性化处理——去除 AI 痕迹,打破统一的句子节奏,改变从句长度。然后以 status='ready' 摄取到 Supabase。第二次人工审查批准后,status 变为 'published'。
本网站生产管道中的真实数据
/tools/ai-citation-checker/ 使用相同链的简化版本。2026 年 5 月的实时数据:
- DataForSEO SERP 调用:5 个查询 × $0.001 = 每次引用检查 $0.005
- Anthropic Claude 摘要:每次检查约 $0.02(Sonnet 4.6,提示缓存)
- 每次使用公开工具的有效成本:约 $0.03
- 速率限制:每个 IP 每小时 3 次新检查;缓存结果无限制
- 每日最坏情况:在所有 IP 全饱和状态下约 $15
- 缓存后实际每日支出:约 $0.80(热门品牌搜索中缓存查询占流量的 90% 以上)
什么应该自动化,什么应该保留人工处理
自动化
- SERP 获取、缓存、监控
- 大规模 Lighthouse + 页面健康审计
- 跨 ChatGPT、Perplexity、Gemini 的 LLM 引用跟踪
- Schema + meta + hreflang 验证
- 内容简介搭建(大纲 + 实体覆盖图)
- 高容量长尾的首稿生成(例如状态码页面、位置页面)
保持人工参与
- 生成草稿前的大纲审批——没有这个关卡的自动化会大规模产出泛用内容
- 发布前的最终审查——每篇旗舰文章
- 话题权威性策略——要建立哪个集群,要跳过什么
- 发现和范围界定电话——30 分钟电话中读出的买方信号无法转移到自动化工作流
- 惩罚诊断和恢复——Google Search Console 异常需要人工比对过往网站的模式匹配
DataForSEO 文章停止的地方,生产开始的地方
DataForSEO 文章展示了 API 表面和一个快乐路径演示。生产层是介于该演示和一个真正排名网站之间的所有东西:缓存策略、cron 计划、force-refresh 上的 JWT 门、阻止直接产品写入的钩子、在消耗 API 成本之前验证响应形状的烟雾测试、Supabase 写入重试、部署门、错误重放。这些都不会在演示中发布,因为它们是基础设施问题,不是 API 问题。
如果你想要 API 接口,DataForSEO 的文档写得很好。如果你想要生产层连接到你的代码库,单域名设置大约需要四到六周的工作,如果你想要多域名或多语言支持则需要更长时间。Claude Code 可以将这个时间缩短到两到三周(按高级费率)。这就是我们提供的合作模式。
合作模式
有三种项目形式可选。构建功能:一个特定的自动化接口(引文追踪器、内容简报生成器、Lighthouse 扫描),1-2 周,£5k-£15k。构建产品接口:营销网站 + 管理后台 + 内容管道 + 自动化钩子,4-8 周,£15k-£45k。构建平台:完整的 SEO 自动化堆栈,包含多域名、多语言、自定义集成,12-20 周,£45k-£150k。
发现阶段是一周的付费工作。输出包括一份书面技术规范、一份固定价格报价和一个有效的烟雾测试,证明 DataForSEO + Anthropic 组合可以针对你的特定代码库运行,然后再进行完整构建。预约一个 30 分钟的通话来开始。