Irgendwann bei Host Nummer 11.000 habe ich wirklich jede Entscheidung, die ich je getroffen habe, in Frage gestellt. Nicht auf dramatische Weise — eher wie das stille, spezifische Unbehagen zu erkennen, dass man sich selbst in eine Ecke gemalt hat mit einem Datensatz, der immer größer wird und einem Schema, das für vielleicht 500 Einträge ausgelegt war. Das war Hostlist. Ein Verzeichnis von Web-Hostern. Alle von ihnen, oder so nah dran wie möglich.
Ich werde dir sagen, was wirklich passiert ist — die Architekturentscheidungen, die Datenmärchen, die Momente, in denen es klappte, und die Dinge, die ich komplett anders machen würde, wenn ich heute anfangen würde.
Warum ein Web-Hosting-Verzeichnis
Ehrlich gesagt? Mich hat es genervt. Ich machte Recherchen für einen Seahawk-Kunden — ein mittelständisches SaaS, das seine Hoster wechseln musste — und ich konnte kein einziges Verzeichnis finden, das sowohl umfassend als auch aktuell war. Die meisten waren entweder dünne Affiliate-Seiten, die neutral vorgaben zu sein, oder veraltete Listen, die immer noch Hoster auflisteten, die 2017 unter die Räder gekommen waren.andcurrent. Most were either thin affiliate pages pretending to be neutral, or outdated lists that still featured hosts that had gone under in 2017.
Die Web-Hosting-Industrie hat tausende aktive Anbieter. Nicht Dutzende. Tausende. Shared-Hoster, verwaltete WordPress-Hoster, VPS-Anbieter, Bare-Metal-Spezialisten, regionale Akteure, von denen du nie gehört hast. Niemand hatte es richtig kartografiert. Also dachte ich: Das mache ich. Sechs Wochen, sagte ich mir.
Es hat erheblich länger als sechs Wochen gedauert.
Der Markt hat den Instinkt jedoch validiert. Schauen Sie sich an, was Nischeverzeichnisse selbst bei bescheidenem Umfang bewirken können — Soak Oregon, ein einfaches Verzeichnis für Thermalquellen, generiert bei nur 25.000 monatlichen Besuchern etwa 1.000 Dollar pro Monat an Werbeeinnahmen. Das ist kein Tippfehler. 25.000 Besucher. Die Wirtschaftlichkeit eines gut ausgerichteten Verzeichnisses unterscheidet sich grundlegend von einer allgemeinen Content-Website.Soak Oregon, a simple hot springs directory, pulls roughly $1,000 a month in ad revenue on just 25,000 monthly visitors. That's not a typo. 25,000 visitors. The economics of a well-targeted directory are genuinely different from a general content site.
Das Datenproblem, das niemand anspricht
Hier versagen die meisten Anleitungen zum Verzeichnisaufbau völlig. Sie werden Ihnen sagen, Sie sollen Kategorien und Listungsfelder einrichten. Okay. Was sie Ihnen nicht sagen werden, ist, dass das Sammeln von 25.000 genauen, strukturierten Datensätzen ein völlig anderes Problem ist.
Mein erster Ansatz war manuelle Recherche plus eine Scraping-Schicht, die ich an einem Wochenende zusammengezimmert habe. Der Scraper funktionierte einwandfrei. Die Daten waren ein Chaos. Hosting-Anbieter ändern ihre Preise ständig. Einige hatten drei verschiedene Markennamen. Einige waren Reseller von Resellern — die gleiche zugrunde liegende Infrastruktur mit fünfzehn verschiedenen Logos. Nur die Deduplizierung hat mich drei Wochen gekostet.datawas chaos. Hosting providers change their pricing constantly. Some had three different brand names. Some were resellers of resellers — the same underlying infrastructure wearing fifteen different logos. Deduplication alone cost me three weeks.
Ein paar Dinge, die ich früher hätte entscheiden sollen:
- Ein kanonischer Datensatz pro juristische Person, nicht pro Marke. Einige Hosts haben vier Marken. Sie sind trotzdem ein Host., not per brand. Some hosts have four brands. They're still one host.
- Aktualitätsdatum bei jedem Feld. Nicht nur „zuletzt aktualisiert" in der Zeile — pro Feld. Preise werden schneller überholt als Feature-Sets.Not just "last updated" on the row — per field. Pricing goes stale faster than feature sets.
- Eine Human-Review-Warteschlange von Tag eins an. Automatisierte Einspeisung ist in Ordnung für den ersten Durchgang. Aber man braucht einen Prozess, um Datensätze zu kennzeichnen, die falsch aussehen, bevor sie live gehen.Automated ingestion is fine for first-pass. But you need a process for flagging records that look wrong before they go live.
Der dritte Punkt besonders. Ich habe ihn anfangs übersprungen und bin dann mit einer Reihe von Einträgen gelandet, die völlig falsche Preisstufen hatten, weil ein Host seine Pläne neu gebrandmarkt hatte und der Scraper auf der alten Seitenstruktur übereingestimmt hatte. Es hat mich ewig gedauert, das zu finden.
Die richtige Tech Stack wählen
Ich bin bei WordPress geblieben. Ich weiß. Aber hör mir zu.
Für ein Verzeichnis in dieser Größenordnung möchte man etwas mit einem ausgereiften Plugin-Ökosystem und einer Query-Ebene, die man gründlich versteht. Ich hatte Directorist bei kleineren Projekten verwendet und es hat sich bewährt — flexibles Schema, funktioniert mit Gutenberg, sinnvolle Standardeinstellungen. Für Hostlist speziell habe ich es mit einer benutzerdefinierten Post-Type-Ebene kombiniert, weil ich Felder brauchte, die kein vorgefertigtes Plugin vorgesehen hatte (Dinge wie Rechenzentrumsstandorte, Peering-Vereinbarungen, Control-Panel-Versionen).Directoriston smaller projects and it held up well — flexible schema, works with Gutenberg, sensible defaults. For Hostlist specifically I paired it with a custom post type layer on top, because I needed fields that no off-the-shelf plugin anticipated (things like data-centre locations, peering arrangements, control panel versions).
Die vier Seiten, die wirklich zählen — und ich würde sagen, das gilt für jedes Verzeichnis unabhängig von der Nische —:
- Homepage mit klarem Zweck, hervorgehobenen Einträgen und einer extrem einfachen Suche
- Archiv-/Browse-Seite mit schneller Filterung (hier verbringen 80% deiner Nutzer Zeit)
- Einzelnes Listing mit vollständigem Datensatz, strukturiertem Daten-Markup und einer Möglichkeit zum Beanspruchen/Melden
- Einreichungsseite (auch wenn du anfangs keine Nutzer-Einreichungen machst, baue sie fertig)
Ich kann die Archiv-Seite nicht genug betonen. Nutzer kommen nicht auf deine Homepage und navigieren dann. Sie landen von Google auf einer Archiv-Seite und entscheiden in vier Sekunden, ob die Daten glaubwürdig aussehen. Mach diese Seite zuerst richtig.thennavigate. They land on an archive page from Google and decide within four seconds whether the data looks credible. Get that page right first.
Was ich an der Stack ändern würde
Benutzerdefinierte Tabellen. Ich hätte die Kern-Listungsdaten viel früher aus den Post-Metadaten und in richtige relationale Tabellen verschieben sollen. WordPress Post Meta funktioniert bis zu vielleicht 5.000 Datensätzen gut. Danach werden die Abfragen schmerzhaft. Die Leistungsaspekte für großflächige Webanwendungen sind real — RAM, Abfrageoptimierung, Caching-Strategie — nichts davon planst du, wenn du nur versuchst, das Ding zu starten.performance considerations for large-scale web applicationsare real — RAM, query optimisation, caching strategy — none of which you plan for when you're just trying to get the thing launched.
Das Verzeichnis selbst hosten (Wirklich unangenehm)
Es gibt eine besondere Ironie darin, ein Web-Hosting-Verzeichnis zu bauen und dann einen Host dafür auszuwählen. Im ersten Jahr bin ich durch drei Hosts gegangen.
Der erste war ein verwalteter WordPress-Host, den ich nicht nennen werde. Er ist beim Importvorgang zusammengebrochen — 25.000 Beiträge, die über WP-CLI eingingen, waren etwas, wofür ihre Infrastruktur nicht ausgelegt war. Der zweite war ein VPS, wo ich mich selbst um alles kümmerte: Nginx als Reverse Proxy, Redis für Object Caching, ufw für die Firewall. Dieser Self-Hosted-Ansatz funktioniert glänzend, wenn du weißt, was du tust — totale Transparenz, kein mysteriöses Drosseln, du kontrollierst die Cache-Header. Aber es ist auch 23 Uhr am Donnerstag, wenn etwas kaputt geht und es ist ganz dein Problem.That self-hosted architecture approach works brilliantly when you know what you're doing— total visibility, no mystery throttling, you control the cache headers. But it's also 11pm on a Thursday when something breaks and it's entirely your problem.
Ich bin auf einem verwalteten VPS mit Root-Zugriff gelandet. Beste aus beiden. Ich behielt Nginx davor, fügte eine CDN-Schicht für die statischen Assets hinzu, und das hat seitdem gehalten.
Die Lektion: Teste deinen Host unabhängig davon, welchen du wählst, mit deinem tatsächlichen Datenvolumen, bevor du dich festlegst. Nicht eine Stichprobe. Dein echter Import. Ein Host, der einen 500-Beiträge-Blog mit Bravour handhabt, bricht manchmal völlig zusammen, wenn du 25.000 Datensätze während eines Datenbankumbaus auf ihn wirfst.test it with your actual data volume before you commit. Not a sample. Your real import. A host that handles a 500-post blog with flying colours will sometimes completely fall over when you throw 25,000 records at it during a database rebuild.
Monetarisierung: Was ich ausprobiert habe, was funktioniert hat
2019 sagte mir ein Kunde einmal: „Das Geld steckt in der Listung, nicht im Traffic." Das habe ich damals nicht vollständig verstanden. Jetzt tue ich es.
Hostlists Einnahmen kamen aus ein paar Quellen, grob in der Reihenfolge, was tatsächlich den Unterschied gemacht hat:
- Hervorgehobene/Premium-Listings — Hosts zahlen dafür, dass sie oben auf relevanten Kategorieseiten erscheinen. Das funktioniert. Die CPMs sind gut, weil die Absicht hoch ist.— hosts pay to appear at the top of relevant category pages. This works. The CPMs are good because the intent is high.
- Verifizierte Abzeichen mit jährlicher Erneuerung — leichter als ein vollständiges Premium-Listing, aber es summiert sich.— lighter-touch than a full premium listing, but it adds up.
- Display-Werbung — ich habe das spät hinzugefügt und es ist bei weitem der schwächste Performer. Die Zielgruppe ist zu klein und zu spezifisch, damit große Werbenetzwerke sie richtig bewerten können.— I added this late and it's the weakest performer by quite a lot. The audience is too small and too specific for broad ad networks to value properly.
- Lead-Generierung / Affiliate — hier war ich vorsichtig, weil ich nicht wollte, dass Hostlist wie jede andere voreingenommene Vergleichsseite aussieht. Ich habe eine kleine Anzahl von Vermittlungsvereinbarungen, aber sie sind offengelegt und begrenzt.— I was cautious here because I didn't want Hostlist to look like every other biased comparison site. I have a small number of referral arrangements but they're disclosed and limited.
Was ich nicht getan habe, ist ein Freemium-Modell, bei dem grundlegende Einträge kostenlos und Upgrades kostenpflichtig sind. Ich habe darüber nachgedacht. Das Problem mit Web-Hosting ist speziell, dass die Provider, die es wert sind, auf deiner Plattform zu sein, auch diejenigen sind, die dein Verzeichnis am wenigsten für Sichtbarkeit brauchen. Die kleineren Hosts profitieren mehr davon, aufgelistet zu werden, aber sie haben auch die kleinsten Budgets. Die Wirtschaft ist schwierig.notdone is a freemium model where basic listings are free and upgrades are paid. I thought about it. The problem with web hosting specifically is that the providers worth having on your platform are also the ones least likely to need your directory for exposure. The smaller hosts benefit more from being listed, but they're also the ones with the smallest budgets. The economics are awkward.
Brilliant Directories und ähnliche Plattformen haben das für stärker gemeinschaftsorientierte Verzeichnisse — Hochzeitsdienstleister, Eltern-Ressourcen — verstanden, wo die Mitglieder wirklich von Locals gefunden werden möchten. Web-Hosting ist anders. Es ist ein globaler, hyperkonkurrenzfähiger Markt.have this figured out for more community-oriented directories — wedding vendors, parenting resources — where the members genuinelywantto be found by locals. Web hosting is different. It's a global, hyper-competitive market.
SEO für ein großes Verzeichnis: Die Dinge, die wirklich geholfen haben
Ein Verzeichnis mit 25.000 Einträgen ist ein SEO-Vorteil, wenn du es richtig machst. Es ist ein SEO-Nachteil, wenn du es nicht machst.
Die spezifischen Dinge, die geholfen haben:
- Einzigartige, vorlagenbasierte, aber variable Meta-Beschreibungen pro Eintrag — nicht nur der Host-Name + "Web-Hosting-Bewertung". Ich habe tatsächliche Datenpunkte (Preisstufe, primärer Anwendungsfall, Gründungsjahr) eingezogen, um Beschreibungen zu generieren, die wirklich unterschiedlich waren.— not just the host name + "web hosting review". I pulled in actual data points (price tier, primary use case, founding year) to generate descriptions that were genuinely different.
- Kategorie- und Tag-Seiten mit echtem redaktionellem Inhalt — nicht nur ein Raster von Karten. Eine 200-Wort-Einführung, die erklärt, was "verwaltetes WordPress-Hosting" wirklich bedeutet, einmal geschrieben, auf die Kategorie angewendet. Google möchte sehen, dass jemand über die Seite nachgedacht hat.— not just a grid of cards. A 200-word intro explaining what "managed WordPress hosting" actually means, written once, applied to the category. Google wants to see that someone thought about the page.
- Strukturierte Daten (Schema.org) — jedes Listing hat LocalBusiness- oder Organization-Markup. Die Klickrate verbesserte sich deutlich, nachdem ich dies ordnungsgemäß hinzugefügt hatte.— every listing has
LocalBusinessorOrganizationmarkup. Click-through rates improved noticeably after I added this properly. - Kanonische URLs bei Filterkombinationen — das hat mich fast umgebracht. Die facettierte Suche generiert Tausende von URL-Kombinationen. Wenn du sie nicht kanonisch zur sauberen Archiv-URL zurückleittest, wirst du innerhalb eines Monats dein Crawl-Budget aufgebraucht haben.— this nearly killed me. Faceted search generates thousands of URL combinations. If you don't canonical them back to the clean archive URL, you'll be crawl-budget bankrupt within a month.
- Nur aktive Hosts indexieren — ich nutze noindex für alles, das ich nicht bestätigen kann, dass es noch läuft. Dead Listings sind schlimmer als kein Listing.— I noindex anything I can't confirm is still operating. Dead listings are worse than no listing.
Das eine, das ich früh falsch gemacht habe: Ich indexierte alles sofort. Auch Stubs mit fast keine Daten. Google crawlte sie, fand dünne Seiten und diskontierte die ganze Domain teilweise für eine Weile. Lektion: Indexiere es nicht, bis es wert ist, indexiert zu werden.don't index it until it's worth indexing.
Was ich anders machen würde
Ein paar Dinge, schnell:
- Starten Sie mit einer kleineren, tighteren Nische zuerst. „Web-Hosting-Verzeichnis" ist riesig. Ich sollte mit „Managed WordPress Hosts" gestartet haben — vielleicht 300–400 Datensätze — das Konzept bewiesen und dann erweitert.
- Bauen Sie die Datenpipeline vor dem Frontend auf. Ich habe es rückwärts gemacht. Das Frontend war live, bevor der Importprozess solide war, was bedeutete, dass ich ständig Live-Daten patchen musste.beforethe front end. I did it backwards. The front end was live before the import process was solid, which meant I was constantly patching live data.
- Verlangen Sie Gebühren für Listings von Tag eins an. Auch £1/Monat. Kostenlose Listings ziehen Hosts an, die das Formular schlecht ausfüllen und nie auf Aktualisierungsanfragen reagieren. Eine kleine Zahlung filtert nach Qualität.
- Investieren Sie früher in ein ordnungsgemäßes Contributor-System. Einige der besten Datenkorekturen, die ich erhalten habe, kamen von Benutzern, die Fehler entdeckten. Ich hatte in den ersten acht Monaten keine strukturierte Möglichkeit, diese zu akzeptieren.
Ehrlich gesagt war der Aufbau von Hostlist eines der technisch interessantesten Nebenprojekte, an denen ich gearbeitet habe – und eines der demütigendsten. Das Verzeichnisformat sieht von außen betrügerisch einfach aus.
---
FAQ
Wie lange hat der Aufbau von Hostlist gedauert?
Die erste Version – grob, voller Datenlücken, aber live – dauerte etwa drei Monate Abende und Wochenenden. Es in einen Zustand zu bringen, auf den ich wirklich stolz war, brauchte näher an ein Jahr. Die Datenqualitätsarbeit hört wirklich nie auf.
Welches WordPress-Plugin hast du für die Verzeichnisfunktionalität verwendet?
Directorist als Basis, dann eine beträchtliche Menge an benutzerdefinierter Entwicklung darauf. Für ein kleineres Verzeichnis würde ich es mehr oder weniger aus der Box verwenden. Bei 25.000 Einträgen musst du ohnehin irgendwann benutzerdefinierte Abfragen schreiben – das Plugin gibt dir nur einen Ausgangspunkt.
Ist ein Web-Hosting-Verzeichnis tatsächlich rentabel?
Es kann sein. Meins deckt seine Kosten und verdient darüber hinaus, aber ich werde nicht so tun, als wäre es eine passive Einkommensmaschine. Die Margen hängen stark davon ab, ob du Premium-Listings verkaufen kannst. Display-Anzeigen allein bringen dich bei moderatem Traffic-Level nicht dorthin.
Wie hältst du 25.000 Einträge aktuell?
Unvollkommen. Ich habe eine Kombination aus geplanten Scrapern, die auf Änderungen von Pricing-Seiten prüfen, eine von der Community gemeldete Korrekturwarteschlange und einen manuellen Überprüfungszyklus für die Top 500 Hosts nach Traffic. Der Long Tail verschlechtert sich im Laufe der Zeit. Ich habe das akzeptiert.
Würdest du empfehlen, ein großes Verzeichnis als erstes Projekt zu bauen?
Nein. Fangen Sie mit etwas an, das Sie in 500 Datensätzen erledigen können. Beweisen Sie, dass Leute es nutzen und dass es einen Monetarisierungsweg gibt. Dann skalieren Sie. Die technische und Datenmanagement-Komplexität eines großen Verzeichnisses ist wirklich nicht trivial, und Sie möchten auf diese Probleme stoßen, nachdem Sie die Idee validiert haben, nicht davor.Thenscale. The technical and data-management complexity of a large directory is genuinely non-trivial, and you want to encounter those problems after you've validated the idea, not before.
---
Das Besondere an Verzeichnissen ist, dass sie ein Langzeitspiel sind. Sie bauen einen Daten-Asset auf, nicht eine Content-Site. Der Traffic wächst langsam, die Arbeit ist wenig glamourös, und in den ersten sechs Monaten fragen Sie sich, ob jemand es bemerkt. Aber wenn die Daten gut und die Nische richtig sind, entwickeln Verzeichnisse eine Art Gravitationskraft, die mit anderen Formaten schwer zu replizieren ist. Deshalb baue ich sie weiter.
