2022 habe ich zugesehen, wie ein Klient £40.000 für den Aufbau eines lokalen Serviceeverzeichnisses verprasste. Wunderbar gestaltet. 80.000 Seiten automatisch generiert aus einer sauberen Airtable-Basis. Launch im März. Im Juni hatte es 214 indexierte Seiten und rankierte für genau nichts. Das Problem war nicht die Idee -- Verzeichnisse sind immer noch eines der wenigen programmatischen SEO-Spiele, die sich zu seriösem organischem Traffic aufbauen können. Das Problem war, dass sie alles technisch korrekt und strategisch falsch gemacht hatten.
Dieser Beitrag ist darüber, diesen Fehler nicht zu machen.
---
Was „Programmatic SEO" 2026 wirklich für ein Verzeichnis bedeutet
Menschen werfen diese Phrase herum, als wäre es eine Sache. Das ist es nicht. Für ein Verzeichnis bedeutet programmatische SEO speziell: Hunderte oder Tausende von orts-, kategorie- oder attribut-bezogenen Seiten aus einer einzigen Vorlage und einer strukturierten Datenquelle generieren -- und das so tun, dass jede Seite Google einen Grund gibt, sie vor einem handgeschriebenen Konkurrenten zu ranken.
Genau dort scheitern die meisten Verzeichnisse.
Die 2026er-Version dieses Spiels ist schwärer als 2019. Googles Helpful Content System ist seit Ende 2023 in den Kern-Ranking-Algorithmus eingebaut, was bedeutet, dass dünne templated Seiten auf Site-Ebene downgerankt werden, nicht nur auf Seiten-Ebene. Ein schlechter Batch kann deine ganze Domain ruinieren. Ich habe es gesehen. Seahawk hatte Ende 2023 ein Travel-Aggregator-Projekt mit 12.000 City-Seiten -- jede mit ungefähr 90 Wörtern und einer Listings-Tabelle -- das das gesamte Crawl-Budget der Domain innerhalb von acht Wochen nach dem Launch in den Keller zog.Google's Helpful Content system has been baked into the core ranking algorithm since late 2023, which means thin templated pages get downweighted at a site level, not just a page level. One bad batch can tank your whole domain. I've seen it. Seahawk had a travel aggregator project in late 2023 where 12,000 city pages -- each with roughly 90 words and a listings table -- dragged the entire domain's crawl budget into the floor within eight weeks of launch.
Die Baseline ist also höher. Aber die Chance ist immer noch riesig.
---
Die Datenschicht ist alles
Fang mit einer Quelle an, die Tiefe hat, nicht nur Breite
Die meisten Verzeichnis-Builder fangen an und fragen sich "wie bekomme ich 50.000 Listings?" Sie sollten fragen "was weiß ich tatsächlich über jedes Listing, das niemand sonst weiß?"
Ich nutze Airtable für kleine bis mittlere Projekte (unter 100k Records) und entweder Supabase oder ein unkompliziertes PostgreSQL-Setup für alles Größere. Das Tool ist weniger wichtig als das Schema. Jedes Listing in deiner Datenbank sollte Felder haben, die differenzierte Seiteninhalte generieren können. Nicht nur Name, Adresse, Telefon. Denk an: Gründungsjahr, Preisrange, durchschnittliches Review-Sentiment, Anzahl der verifizierten Reviews, Spezialgebiete, letztes Verifikationsdatum, Entfernung vom Stadtzentrum, ob sie einen physischen Standort oder nur Remote haben.Supabase or a straightforward PostgreSQL setup for anything larger. The tool matters less than the schema. Every listing in your database should have fields that can generate differentiated page content. Not just name, address, phone. Think: year founded, price range, average review sentiment, number of verified reviews, specialisms, last verified date, distance from city centre, whether they have a physical location vs. remote-only.
Mehr Felder = mehr Winkel für On-Page-Differenzierung. So einfach ist das.
Scraping vs. lizenzierte Daten vs. vom Nutzer eingereichte Daten
Ehrlich gesagt: Alle drei haben ihre Rolle, und ich habe alle drei verwendet.
- Gekratzte Daten sind schnell und günstig, bauen aber schnell ab. Ich betrieb 2021 ein UK-Accountants-Verzeichnis, das Companies House-Daten kratzte. Innerhalb von 14 Monaten waren 23% der Records veraltet. is fast and cheap but degrades quickly. I ran a UK accountants directory in 2021 that scraped Companies House data. Within 14 months, 23% of the records were stale.
- Lizenzierte Daten-Feeds (denke: Dun & Bradstreet, Yext oder vertikale APIs) sind teuer, aber akkurat. Es lohnt sich, wenn dein Monetarisierungsmodell das unterstützt.(think Dun & Bradstreet, Yext, or vertical-specific APIs) are expensive but accurate. Worth it if your monetisation model supports it.
- Von Nutzern eingereichte Listings starten langsam, aber erzeugen die Frische-Signale, die Google belohnt. Füge einen „Claim your listing"-Flow von Tag eins hinzu, auch wenn du nur zweihundert Listings total hast. start slow but create the freshness signals Google rewards. Add a "claim your listing" flow from day one, even if you have two hundred listings total.
Die Verzeichnisse, die Traffic über 18-24 Monate aufbauen, sind fast immer die, die lizenzierte Seed-Daten mit laufenden Benutzerbeiträgen mischen.
---
Template-Architektur: Der Teil, über den niemand spricht
Hier ist das, das die meisten Tutorials auslassen. Der Unterschied zwischen einem programmatischen Verzeichnis, das rankt, und einem, das in der Oblivion gefiltert wird, liegt normalerweise auf Template-Ebene -- nicht auf Daten-Ebene.
Ein Template reicht nicht aus
Du brauchst mindestens drei Template-Ebenen:
- Hub-Seiten -- "Best Solicitors in London" Stil. Hoher Wettbewerb, redaktioneller Ton, manuell kuratiert oder stark angereichert. Das sind die Seiten, auf die du Links pointest. -- "Best Solicitors in London" style. High competition, editorial tone, manually curated or heavily enriched. These are the pages you point links at.
- Kategorie × Ort Seiten -- "Family Law Solicitors in Manchester". Mid-Tail. Diese können mehr templated sein, brauchen aber mindestens einen dynamischen Bereich, der wirklich einzigartige Daten zieht (Review-Counts, durchschnittliche Gebührenspanne, bemerkenswerte Listings). -- "Family Law Solicitors in Manchester". Mid-tail. These can be more templated but need at least one dynamic section that pulls genuinely unique data (review counts, average fee bracket, notable listings).
- Einzelne Listing-Seiten -- Die Blattknoten. Diese leben oder sterben durch Datenreichtum. Wenn jede Listing-Seite die gleiche 60-Wort-Beschreibung und eine Telefonnummer hat, wird Google das schnell herausfinden. -- The leaf nodes. These live or die by data richness. If every listing page has the same 60-word description and a phone number, Google will figure that out fast.
Ich habe diese Aufteilung auf vier Directory-Projekten in den letzten zwei Jahren getestet. Die mit einer klaren dreistufigen Hierarchie übertrafen flache Architekturen konsistent in Google Search Console Impressionsdaten innerhalb der ersten 90 Tage nach dem Indexing. Keine Zufälligkeit.Google Search Console impression data within the first 90 days of indexing. Not a coincidence.
Dynamische Inhaltsblöcke, die wirklich helfen
Hör auf, Seiten mit von KI generierter Standard-Textbox zu vollstopfen. Baue stattdessen Template-Logik, die folgendes abruft:
- Ähnliche Einträge im gleichen Postleitzahlbereich
- „Auch angesehen"-Kategorien aus deinen eigenen Analytics
- Ein „Zuletzt aktualisiert"-Zeitstempel, der tatsächlich korrekt ist (nicht nur heute's Datum, das JS einfügt)
- Benutzer-Review-Snippets, auch wenn du nur drei Reviews hast -- drei echte schlagen null gefälschte.
Das Ziel ist, dass ein Mensch, der auf einer Leaf-Node-Listungsseite landet, mit etwas weggeht, das er sich selbst nicht hätte googeln können.
---
Interne Verlinkung: Dein am meisten unterschätzter Ranking-Hebel
Ich bin ehrlich. Die meisten programmatischen Verzeichnisse haben katastrophale interne Verlinkung. Seiten existieren. Sie verweisen nirgendwohin Sinnvolles. Googles Crawler besucht die Seite einmal, sieht eine Sackgasse und stuft das ganze Unterverzeichnis herab.
Eine richtige interne Verlinkungsarchitektur für ein Verzeichnis sieht ungefähr so aus:
- Homepage → Top-Hub-Seiten (manuell kuratiert, 8–15 Links)
- Hub-Seiten → Kategorie × Standort-Seiten (dynamisch, basierend auf Listungsanzahl)
- Kategorie × Ort-Seiten → einzelne Einträge (paginiert, max. 20–25 pro Seite)
- Einzelne Einträge → zugehörige Kategorie × Ort-Seiten (2–3 kontextuelle Links)
- Individuelle Listings → „nahegelegene" Listings über eine distanzbasierte Abfrage
Das letzte -- nahegelegene Einträge -- wird unterschätzt. Es schafft ein durchsuchbares Netz in deinen Blattknoten, das Googlebot durch die Website bewegt, statt dass er zurück zum Hub springt. Ich habe das Anfang 2024 bei einem Zahnärzteverzeichnis für einen Kunden in Birmingham umgesetzt und die Crawl-Rate in der GSC stieg innerhalb von sechs Wochen um das 3,4-Fache.
Nutze Screaming Frog, um dein Link-Diagramm vor dem Launch zu prüfen, nicht danach. Der kostenlose Layer handhabt bis zu 500 URLs, was für eine Sanity Check deiner Templates genug ist.Screaming Frog to audit your link graph before you launch, not after. The free tier handles up to 500 URLs, which is plenty for a sanity check on your templates.
---
Indexierung im großen Maßstab — ohne dabei hängenzubleiben
Google wird nicht alle 80.000 deiner Seiten indexieren. Akzeptiere das. Arbeite damit.
Der praktische Ansatz, den ich verwende:
- Reiche nur deine Hub- und Kategorie × Standort-Seiten in der Sitemap am Launch-Tag ein
- Lass Google Leaf Nodes durch interne Links entdecken, nicht über die Sitemap
- Nutze noindex aggressiv auf dünnen, duplizierten oder datenarm gefüllten Listing-Seiten, bis du sie anreichern kannst.
noindexaggressively on thin, duplicate, or low-data listing pages until you can enrich them - Richte einen Crawl-Budget-Report in der GSC ein (Einstellungen → Crawl-Statistiken) und überprüfe ihn in den ersten drei Monaten wöchentlich
Der noindex-Rat bekommt immer Gegenwind. „Aber ich will, dass alle meine Seiten indexiert werden!" Ja. Und Google will, dass alle gut sind. Du kannst nicht 40.000 dünne Seiten indexiert haben und gleichzeitig eine gesunde Domain Authority haben. Such dir eins aus.noindex advice always gets pushback. "But I want all my pages indexed!" Yeah. And Google wants all of them to be good. You can't have 40,000 thin pages indexed and also have a healthy domain authority. Pick one.
Noch eine Sache: Pagination. Nutze korrektes rel="next" und rel="prev" wo passend, aber überleg auch, ob du überhaupt paginierte Kategorieseiten brauchst. Bei drei rezenten Projekten habe ich paginierte Listings durch einen JS-geladenen „show more"-Ansatz ersetzt (mit statischem Fallback für Crawler) und sah sauberere Indexationsmuster in GSC innerhalb von 60 Tagen.rel="next"and rel="prev"where appropriate, but also consider whether you need paginated category pages at all. On three recent projects I replaced paginated listings with a JS-loaded "show more" approach (with a static fallback for crawlers) and saw cleaner indexation patterns in GSC within 60 days.
---
Content-Anreicherung im großen Maßstab, ohne den Verstand zu verlieren
Richtig. Also hast du akzeptiert, dass dünne Seiten den Tod bedeuten. Wie reichern du tatsächlich 20.000 Listenseiten an, ohne ein Team von Content-Writern zu haben?
Ein paar Ansätze, die in der Praxis funktionieren:
- Strukturierte Bewertungsaggregation. Hole Daten aus Google Business Profile über deren API, oder scrape (vorsichtig) von Trustpilot oder Yelp, wo die Nutzungsbedingungen es erlauben. Schon eine Sternbewertung + Bewertungsanzahl, die als strukturierte Daten angezeigt wird, ergibt einen messbaren Unterschied.Pull from Google Business Profile data via their API, or scrape (carefully) from Trustpilot or Yelp where ToS allows. Even a star rating + review count displayed as structured data adds measurable differentiation.
- Automatisierte Aktualitätssignale. Schreibe ein Skript, das wöchentlich deine Einträge aufruft und überprüft, ob sich die Geschäftswebsite, Telefonnummer oder Adresse geändert hat. Aktualisiere den Datensatz. Zeige das Datum „Zuletzt verifiziert" auf der Seite an. Allein das reduzierte unsere Absprungrate bei einem Juristenverzeichnis um 18 % -- Nutzer vertrauen aktuellen Daten.Write a script that hits your listings weekly and checks whether the business website, phone, or address has changed. Update the record. Show the "last verified" date on the page. This alone reduced our bounce rate on a legal directory by 18% -- people trust current data.
- KI-gestützte Zusammenfassungen, mit Bedacht eingesetzt. Ich nutze GPT-4 um strukturierte Zusammenfassungen für Einträge zu generieren, bei denen wir genug Rohdaten haben. Aber der Prompt ist streng auf die spezifischen Datenfelder für diesen Eintrag begrenzt -- es generiert keine generische Beschreibung. Und jede Zusammenfassung läuft durch einen Ähnlichkeitsprüfung (ich nutze ein einfaches Cosine-Similarity-Skript gegen das gesamte Datenvolumen), um nahezu identische Outputs abzufangen, bevor sie live gehen.I do use GPT-4 to generate structured summaries for listings where we have enough raw data. But the prompt is tightly constrained to the specific data fields for that listing -- it's not generating generic blurb. And every summary is filtered through a similarity check (I use a basic cosine similarity script against the full corpus) to catch near-duplicate outputs before they go live.
---
Das Monetarisierungsmodell formt deine SEO-Architektur
Das überrascht viele. Wie du planst, mit dem Verzeichnis Geld zu verdienen, beeinflusst direkt, welche Seiten du priorisierst, wie viel Datentiefe du brauchst und ob du dir die Content-Anreicherung leisten kannst, die Ranking erfordert.
Die drei Modelle, die ich konsistent funktionieren sah:
- Bezahlte Listings / Featured Placement. Einfach. Unternehmen zahlen, um höher zu erscheinen oder mit erweiterten Profilen angezeigt zu werden. Das motiviert dich, die kostenlose Stufe zu wachsen und die Marketplace-Dynamik zu schaffen.Simple. Businesses pay to appear higher or with enhanced profiles. Incentivises you to grow the free tier to create the marketplace dynamic.
- Lead Generation. Du erfasst Anfragformulare und verkaufst sie an Unternehmen weiter. Höherer Umsatz pro Konversion, erfordert aber deutlich umfangreichere Listenseiten, um das Vertrauen zu schaffen, das für Formularabsendungen nötig ist.You capture enquiry form submissions and sell them to businesses. Higher revenue per conversion but requires significantly richer listing pages to earn the trust needed for form fills.
- Affiliate / Empfehlungen. Funktioniert gut in Branchen wie Software, Finanzen oder Gastgewerbe, wo es etablierte Affiliate-Programme gibt. Nischen-Verzeichnisse in SaaS-Tool-Kategorien können mit diesem Modell £10.000–£30.000/Monat erreichen bei unter 5.000 Seiten, wenn das Keyword-Targeting stimmt.Works well in verticals like software, finance, or hospitality where there are established affiliate programmes. Niche directories in SaaS tool categories can hit £10k-£30k/month on this model with under 5,000 pages if the keyword targeting is right.
Wähle dein Modell, bevor du deine Templates designst. Ein Lead-Gen-Verzeichnis braucht Vertrauenssignale und Konversionselemente von Tag eins in jeder Eintragsseite eingebaut -- sie später hinzuzufügen ist immer unordentlicher, als es klingt.
---
FAQ
Funktioniert programmatische SEO noch nach Googles Algorithm-Updates 2024?
Ja, aber die Messlatte für „gut genug" ist deutlich höher als noch vor zwei Jahren. Das Google Core Update im März 2024 traf viele dünne programmgesteuerte Sites hart -- besonders solche, die auf vorlagengestützte KI-Inhalte ohne einzigartige Daten setzten. Sites mit echtem Datentiefgang und klaren Entity-Beziehungen kamen ungeschoren davon. In manchen Branchen gewannen diese Sites sogar Boden, als dünne Konkurrenten herausgefiltert wurden.March 2024 Google core update hit a lot of thin programmatic sites hard -- particularly those relying on templated AI content with no unique data. Sites with genuine data depth and clear entity relationships weathered it fine. In some verticals, those sites actually gained ground as thin competitors got filtered out.
Wie viele Seiten sollte ich am ersten Tag starten?
So wenig, wie du brauchst, um das Konzept Google zu demonstrieren. Ich würde lieber mit 500 echten guten Seiten starten als mit 50.000 dünnen. Baue erst deine Hub-Pages und die Top-20-Kombinationen aus Kategorie × Standort. Lass sie indexieren, generiere erste Ranking-Signale, dann rolle den Long Tail in Batches aus. Mit 100.000 Seiten im ersten Monat zu starten ist fast immer ein Fehler.
Welches CMS oder Tech-Stack sollte ich nutzen?
Für die meisten Kunden nutze ich immer noch WordPress mit einem Custom Post Type und ACF Pro, das aus einer Datenbank zieht. Es ist nicht glamourös, aber schnell zu bauen, einfach weiterzugeben, und das Plugin-Ökosystem für SEO (speziell Rank Math) ist ausgereift. Für größere Projekte -- über 50.000 Seiten -- gehe ich normalerweise headless mit Next.js und einem PostgreSQL- oder Supabase-Backend. Die SSG/ISR-Fähigkeiten in Next.js sind im großen Maßstab wirklich nützlich, um Crawl-Verhalten sauber zu halten.WordPress with a custom post type and ACF Pro pulling from a database. It's not glamorous but it's fast to build, easy to hand off, and the plugin ecosystem for SEO (Rank Math, specifically) is mature. For higher-scale projects -- over 50,000 pages -- I'll typically go headless with Next.js and a PostgreSQL or Supabase backend. The SSG/ISR capabilities in Next.js are genuinely useful for keeping crawl behaviour clean at scale.
Wie lange, bis ein programmatisches Verzeichnis anfängt zu ranken?
Realistisch? Sechs bis neun Monate für spürbaren Traffic, vorausgesetzt, die Architektur stimmt und du bewegst dich in einem Bereich, in dem Google nicht explizit große etablierte Marken bevorzugt. Ich habe außergewöhnliche Fälle gesehen, die in vier Monaten Fahrt aufgenommen haben, und enttäuschende, die 18 Monate brauchten. Die Variable, die am meisten zählt, ehrlich gesagt, ist topical authority -- wie klar deine Website von Tag eins an Expertise in einem bestimmten Bereich etabliert.
---
Das Directory-SEO-Playbook ist nicht tot. Es wurde von Google nur ordnungsgemäß preisdiskriminiert. Die Betreiber, die 2023-24 Verluste erlitten haben, bauten meistens für Volumen statt für Wert. Baue zuerst für Wert -- tiefe Daten, ehrliche Anreicherung, eine Link-Architektur, die respektiert, wie Google tatsächlich crawlt -- und das Volumen regelt sich mit der Zeit von selbst. Das war schon immer so.
