तीन साल पहले एक retailer Seahawk के पास आया जिसने एक "top-tier" agency को enterprise SEO audit के लिए £28,000 दिए थे। उन्होंने मुझे एक 94-page की PDF दी। शानदार formatting। Executive summary दूसरे पेज पर, colour-coded priority matrices, सब कुछ था। और page 61 पर, लगभग एक afterthought के तौर पर, असली crawl data था -- एक single Screaming Frog screenshot बिना किसी annotation के, कोई fix recommendation नहीं, revenue से कोई tie नहीं। Twenty-eight thousand pounds।
मुख्य बात यह है: अधिकांश एंटरप्राइज़ SEO ऑडिट सिर्फ़ टूल के निर्यात होते हैं जिनमें कीमत लगी होती है; एक असली ऑडिट इंजीनियरों के नाम बताता है, रेंडर किए गए पेजों के नमूने दिखाता है, और फ़िक्स को राजस्व प्रभाव के आधार पर क्रमबद्ध करके भेजता है।Most enterprise SEO audits are tool exports with a price tag; a real one names the engineers, samples rendered pages, and ships fixes ranked by revenue impact.
उस experience ने उस चीज़ को crystallise कर दिया जिसका मुझे 12,000 से ज़्यादा sites बनाने के बाद से संदेह था: अधिकांश agencies audit का appearance बेचते हैं, audit itself नहीं। तो अगर आप एक commission करने वाले हैं -- या पहले से ही एक आपके inbox में बैठा है और आप सोच रहे हैं कि क्या यह कागज़ पर printed होने के लायक़ है -- यहाँ बताया गया है कि आपको वाक़ई क्या demand करना चाहिए।
---
Brief का ऑडिट से पहले आना चाहिए
यहाँ बात यह है जिस पर ज्यादातर क्लाइंट्स back नहीं लेते: एजेंसी सही सवाल पूछने से पहले crawl करना शुरू कर देती है।
एक legitimate enterprise audit एक scoping call के साथ शुरू होता है जहाँ आप उनसे ज़्यादा बोलते हैं। Site architecture क्या है? Monolith CMS, headless, hybrid? कितने indexable URLs हैं -- 10,000 या 10 million? क्या subdomains हैं, ccTLDs, hreflang implementations markets के across? आपके CFO के लिए "success" का मतलब क्या है, आपके marketing director के लिए नहीं?you talk more than they do. What's the site architecture? Monolith CMS, headless, hybrid? How many indexable URLs -- 10,000 or 10 million? Are there subdomains, ccTLDs, hreflang implementations across markets? What does "success" mean to your CFO, not your marketing director?
अगर कोई एजेंसी इसे छोड़ देता है और सीधे "हम क्रॉल चलाएंगे और दो हफ़्ते में वापस आएंगे" कहता है, तो यह एक बड़ा रेड फ़्लैग है।
मैं हमेशा किसी भी technical work शुरू करने से पहले एक written scope document पर insist करता हूँ। एक page ठीक है। इसमें exact domains जो audit किए जा रहे हैं, tools जो use किए जा रहे हैं, क्या in scope है और -- critically -- क्या explicitly out of scope है, इन सभी को list करना चाहिए। इसके बिना, आप एक ऐसी report के साथ end up करेंगे जो गलत चीज़ को beautifully audit करती है।out of scope. Without that, you'll end up with a report that audits the wrong thing beautifully.
---
तकनीकी क्रॉल: नींव, पूरी बिल्डिंग नहीं
Screaming Frog या Sitebulb से क्रॉल रिपोर्ट बेसिक्स हैं। हर एजेंसी यह करती है। एक असली ऑडिट को टेम्पलेट जॉब से अलग करने वाली चीज़ क्रॉल डेटा आने के बाद क्या होता है।Screaming Frog or Sitebulb is table stakes. Every agency does this. What separates a real audit from a template job is what happens after the crawl data comes in.
क्रॉल को क्या कवर करना चाहिए
- Crawl budget analysis -- सिर्फ़ "यहाँ आपकी 4xx errors हैं" नहीं बल्कि Googlebot कैसे अपना crawl allocation आपकी site के across spend कर रहा है इसका एक actual breakdown
- रीडायरेक्ट चेनें (एंटरप्राइज़ स्केल पर दो से ज़्यादा हॉप वास्तव में महंगे हैं)
- कैनोनिकल कॉन्फ़्लिक्ट, विशेषकर तब बहुत ख़तरनाक जब आपके पास फेसेटेड नेविगेशन या Shopify-plus सेटअप है जिसमें कलेक्शन और प्रोडक्ट URL ओवरलैप हो
- Core Web Vitals per template type, सिर्फ़ site-wide averages नहीं -- एक homepage का LCP pass होना कुछ भी नहीं मायने रखता अगर आपके 50,000 PDP pages fail कर रहे हैं per template type, not just site-wide averages -- a homepage passing LCP means nothing if your 50,000 PDP pages are failing
- JavaScript रेंडरिंग समस्याएं, रेंडर तुलना के माध्यम से पुष्टि की गई (raw HTML बनाम rendered DOM), अनुमान से नहीं
Seahawk के पास पिछले साल एक B2B SaaS client था -- 180,000 URLs, Angular front-end -- जहाँ crawl surface पर clean दिख रहा था। Everywhere 200s। लेकिन जब हमने Google Search Console के URL Inspection tool को एक manual Puppeteer check के साथ-साथ एक render comparison चलाया, तो उनके body copy का लगभग 40% Googlebot के लिए invisible था। Crawl report अकेले इसे completely miss कर देती। यह वह तरह की चीज़ है जो एक enterprise audit को catch करने की ज़रूरत होती है।looked clean on the surface. 200s everywhere. But when we ran a render comparison using Google Search Console's URL Inspection tool alongside a manual Puppeteer check, about 40% of their body copy was invisible to Googlebot. The crawl report alone would have completely missed it. That's the kind of thing an enterprise audit needs to catch.
लॉग फाइल विश्लेषण
ईमानदारी से कहूँ, तो यहीं मैं उन एजेंसियों को अलग करता हूँ जो अपना काम जानती हैं और जो नहीं जानतीं। सीधे पूछें: "क्या आप हमारे सर्वर लॉग का विश्लेषण करेंगे?" अगर वे संकोच करें, या कहें "हम GSC डेटा को प्रॉक्सी के रूप में उपयोग करेंगे," तो स्केल पर यह काफी नहीं है।
लॉग फाइल विश्लेषण आपको बताता है कि Googlebot वास्तव में क्या कर रहा है, न कि आप क्या सोचते हैं कि वह क्या कर रहा है। यह कौन से URLs को रोज़ विज़िट कर रहा है? कौन से अनदेखे किए जा रहे हैं? क्या यह उस पेजिनेशन पर क्रॉल बर्बाद कर रहा है जिसे कोई लिंक नहीं करता? आप इन सवालों का जवाब अकेले GSC से नहीं दे सकते।actually doing, not what you think it's doing. Which URLs is it visiting daily? Which are being ignored? Is it wasting crawls on pagination nobody links to? You can't answer those questions from GSC alone.
---
On-Page और Content Signals
कंटेंट विश्लेषण के बिना Technical SEO आधा काम है।
Audit को topical authority को assess करना चाहिए -- क्या आप वाक़ई उन subjects को cover कर रहे हैं जिनके लिए rank करने की कोशिश कर रहे हैं, या क्या आप key areas में thin हैं? मैं Semrush के topic research और आपके top 50 landing pages की एक manual review को combine करता हूँ organic traffic के आधार पर। Manual bit matter करता है। Automated content scores (Surfer SEO को देखते हुए) directionally useful होते हैं लेकिन वे किसी को actually आपके pages पढ़ने और पूछने "क्या यह query को competitor से बेहतर answer करता है?" का substitute नहीं हैं।
कैनिबलाइजेशन मैपिंग
यह वह एक चीज़ है जिसे मैं large sites के लिए audits में किसी और चीज़ से ज़्यादा skip होते हुए देखता हूँ। Keyword cannibalisation -- जहाँ multiple URLs same intent के लिए compete करते हैं -- enterprise scale पर endemic है। कोई भी site जिसके पास एक blog है, एक resources section है, और एक product catalogue है वह almost certainly कहीं न कहीं अपने आप को cannibalise कर रहा है।
ऑडिट डिलीवरेबल यहाँ एक असली स्प्रेडशीट होना चाहिए: query cluster, प्रतिस्पर्धी URLs, GSC में ट्रैफिक स्प्लिट, और किस URL को consolidate करने का सुझाव। बस एक पैराग्राफ नहीं जो कहे "कैनिबलाइजेशन मिली।" एक स्प्रेडशीट जो आप डेवलपर को दे सकें।
---
बैकलिंक प्रोफाइल: ईमानदार आकलन, Vanity Metrics नहीं
मैंने एजेंसियों को बैकलिंक रिपोर्ट प्रस्तुत करते देखा है जो "आपकी साइट के पास 24 लाख बैकलिंक हैं!" से शुरू होती है, जैसे कि यह अपने आप में अच्छी खबर है। Domain count का कोई मतलब नहीं है बिना context के।
जो आपको चाहिए वह एक structured analysis है जो शामिल करता है:
- लिंक वेलोसिटी -- क्या आपकी प्रोफाइल ऑर्गेनिकली बढ़ रही है या 2021 में स्पाइक आया और तब से फ्लैट है? -- is the profile growing organically or did you spike in 2021 and flatline since?
- एंकर टेक्स्ट डिस्ट्रिब्यूशन -- ओवर-ऑप्टिमाइज़्ड एक्सैक्ट-मैच एंकर अभी भी 2024 में मैनुअल एक्शन का रिस्क हैं -- over-optimised exact-match anchors are still a manual action risk in 2024
- टॉक्सिक लिंक असेसमेंट -- Ahrefs या Majestic का इस्तेमाल करें, सिर्फ किसी टूल के "toxicity score" पर निर्भर न रहें जो वास्तव में यह बता ही नहीं सकता कि एक लिंक प्रॉब्लेमेटिक क्यों है -- using Ahrefs or Majestic, not just a traffic-light "toxicity score" from a tool that can't actually tell you why a link is problematic
- कम्पिटिटर गैप एनालाइसिस -- कौन से डोमेन आपके तीन सबसे करीबी कम्पिटिटर्स को लिंक कर रहे हैं लेकिन आपको नहीं, और क्या वे लिंक्स रिएलिस्टिकली एक्वायर करने लायक हैं? -- which domains are linking to your three closest competitors but not to you, and are those links realistically acquirable?
- पिछले 90 दिनों में खोए हुए लिंक्स -- अक्सर पहली सिग्नल होती है कि साइट माइग्रेशन के बाद कुछ गलत हुआ -- often the first signal that something went wrong after a site migration
डिसएवाउ फाइल सवाल अपनी खुद की बातचीत है। मैं डिसएवाउ की सिफारिश करने में सावधान हूँ जब तक कि स्पष्ट अप्राकृतिक लिंक पैटर्न और मैनुअल एक्शन का इतिहास न हो। बहुत सारी एजेंसियाँ गतिविधि प्रदर्शन के रूप में आक्रामक तरीके से डिसएवाउ करती हैं। ज्यादातर समय इससे कुछ नहीं होता। कभी-कभी यह चीजों को और खराब कर देता है।
---
साइट आर्किटेक्चर और आंतरिक लिंकिंग
एंटरप्राइज स्तर पर, आंतरिक लिंकिंग एक बाद की सोच नहीं है। यह है कि PageRank कैसे बहता है। और यह लगभग हमेशा तरीकों से टूटा हुआ है जिसे किसी ने तीन साल तक नहीं देखा है।
2019 में एक क्लाइंट ने मुझे एक न्यूज़ और मीडिया साइट के लिए ब्रीफ दिया -- करीब 20 लाख इंडेक्स्ड पेजेस। उनके नए आर्टिकल्स क्रॉल और इंडेक्स हो रहे थे, लेकिन 18 महीने से पुरानी कंटेंट पर लगभग कोई इंटरनल लिंक्स नहीं थे, और उनकी ऑर्गैनिक ट्रैफिक एवरग्रीन कंटेंट पर दो साल से लगातार घट रही थी। किसी ने इन दोनों फैक्ट्स को कनेक्ट नहीं किया। एक इंटरनल लिंकिंग ऑडिट और साइलो रीस्ट्रक्चर के बाद, वह एवरग्रीन ट्रैफिक चार महीने में 34% रिकवर हुआ।
आर्किटेक्चर के लिए ऑडिट डिलीवरेबल में शामिल होना चाहिए:
- एक दृश्य साइट मैप (sitemap.xml नहीं, एक वास्तविक आरेख) जो प्रत्येक प्रमुख सेक्शन की गहराई दिखाता है
- ऑर्फन पेज आइडेंटिफिकेशन -- URLs जिनके ऊपर कोई इंटरनल लिंक्स नहीं हैं
- लिंक इक्विटी फ्लो विश्लेषण: कौन से पेज उच्च अथॉरिटी रखते हैं पर इसे कहीं उपयोगी जगह पास नहीं कर रहे?
- नेविगेशन ऑडिट -- क्या आपके प्राइमरी नैव लिंक्स सबसे हाई-वैल्यू कन्वर्शन पेजेस पर जा रहे हैं, या एक "About Us" सेक्शन पर जो कोई क्लिक ही नहीं करता?
---
डिलिवरेबल वास्तव में कैसा दिखना चाहिए
आइए विशिष्ट हों। एक सही enterprise SEO ऑडिट डिलिवरेबल एक पीडीएफ नहीं होता।
यह एक पैकेज है:
- एक्जिक्यूटिव समरी (2-3 पेज मैक्स) नॉन-टेक्निकल स्टेकहोल्डर के लिए लिखी हुई -- कोई जार्गन नहीं, रेवेन्यू और ट्रैफिक ऑपरच्यूनिटी एस्टीमेट्स से जुड़ी हुई (2-3 pages max) written for a non-technical stakeholder -- no jargon, tied to revenue and traffic opportunity estimates
- टेक्निकल ऑडिट डॉक -- पूरी क्रॉल फाइंडिंग्स, लॉग फाइल एनालाइसिस, रेंडरिंग इश्यूज, स्पीड मेट्रिक्स -- सेवरिटी रेटिंग्स और स्पेसिफिक फिक्स इंस्ट्रक्शन्स के साथ -- full crawl findings, log file analysis, rendering issues, speed metrics -- with severity ratings and specific fix instructions
- कंटेंट और ऑन-पेज डॉक्यूमेंट -- कैनिबलाइजेशन मैप, थिन कंटेंट फ्लैग, टॉपिकल गैप एनालिसिस -- cannibalisation map, thin content flags, topical gap analysis
- बैकलिंक रिपोर्ट -- वह पाँच कंपोनेंट जो मैंने ऊपर लिस्ट किए हैं, एक ऐसे फॉर्मेट में जिस पर कोई एक्शन ले सके -- the five components I listed above, in a format someone can act on
- आर्किटेक्चर और इंटरनल लिंकिंग डॉक्यूमेंट -- ऑर्फन पेज, साइलो रिकमेंडेशन, नैव रिव्यू -- orphan pages, silo recommendations, nav review
- प्रायोरिटाइज्ड रोडमैप -- एक नंबर्ड लिस्ट, मैट्रिक्स नहीं, जो आपकी डेव टीम को बताता है कि किस क्रम में क्या ठीक करना है और क्यों -- a numbered list, not a matrix, that tells your dev team what to fix in what order and why
वह आखिरी बात सबसे ज़्यादा मायने रखती है। प्राथमिकता। मैंने ऐसी audits पढ़ी हैं जिनमें 400 समस्याओं को फ्लैग किया गया था और कोई संकेत नहीं कि पहले कौन सी तीन को ठीक करना है। यह audit नहीं है। यह डेटा डंप है।
---
काम देने से पहले एजेंसी की जांच कैसे करें
कुछ चीजें जो मैं किसी को भी enterprise audit सौंपने से पहले पूछता हूँ।
पहला: मुझे एक redacted नमूना deliverable दिखाइए। टेम्पलेट नहीं, एक असली। अगर वह नहीं करेंगे, तो चले जाइए।
दूसरा: वास्तव में काम कौन कर रहा है? बहुत सारी एजेंसियों में, senior व्यक्ति audit को sell करता है और एक junior analyst उसे deliver करता है। अगर senior समीक्षा कर रहा है और sign off कर रहा है तो ठीक है। लेकिन आपको पता होना चाहिए कि crawl विश्लेषण कौन लिख रहा है। नाम से पूछें।
तीसरा: जब आप ऑडिट के बीच में कुछ अनपेक्षित पाते हैं तो आपकी प्रक्रिया क्या है? एंटरप्राइज साइट्स से आश्चर्य भरे होते हैं -- अचानक ट्रैफिक ड्रॉप, स्टेजिंग एनवायरनमेंट्स गलती से इंडेक्स हो जाना, hreflang 404s की ओर पॉइंट करना। एक अच्छी एजेंसी के पास इन चीजों को एस्केलेट करने का प्रोटोकॉल होता है, न कि उन्हें अपेंडिक्स F में दबाने का।
और सच में? उनसे पूछें कि enterprise audit पर उन्होंने सबसे बड़ी गलती कभी क्या की थी। जवाब आपको सब कुछ बता देता है। एक एजेंसी जो कहती है "हमें कभी कोई बड़ी समस्या नहीं हुई है" तो या तो उन्होंने बहुत सारे enterprise audits नहीं किए हैं या आपको सच नहीं बता रहे हैं। बड़े पैमाने पर हर audit कुछ असुविधाजनक निकालता है। यही तो पूरा मुद्दा है।
---
FAQ
एंटरप्राइज SEO ऑडिट में कितना समय लगना चाहिए?
50,000 से 500,000 URLs वाली साइट के लिए, अगर सही तरीके से किया जाए तो चार से छह हफ्ते उचित है। मुझे उन एजेंसियों पर संदेह है जो इस स्केल पर दो हफ्ते की गारंटी देती हैं -- या तो वह लॉग फाइल एनालिसिस छोड़ रहे हैं, या "ऑडिट" एक ऑटोमेटेड रिपोर्ट है जिसमें हल्का कमेंटरी है। 10 हफ्ते से ज्यादा और आपको पूछना चाहिए कि असल में क्या समय ले रहा है।
एंटरप्राइज SEO ऑडिट की कीमत क्या होनी चाहिए?
ईमानदारी से कहूँ तो रेंज काफी व्यापक है। एक गंभीर ऑडिट के लिए -- सही तकनीकी क्रॉल, लॉग फाइल एनालिसिस, कंटेंट रिव्यू, बैकलिंक असेसमेंट, आर्किटेक्चर रिव्यू -- आप £8,000-£25,000 की सीमा में देख रहे हैं, यह साइट की कॉम्प्लेक्सिटी, मार्केट स्कोप, और इस बात पर निर्भर करता है कि hreflang या मल्टी-डोमेन सेटअप शामिल हैं या नहीं। एक सच में बड़ी साइट के लिए £4,000 से कम कीमत लगभग निश्चित रूप से टेम्पलेट वर्क है।
क्या समस्याओं को ठीक करने वाली एजेंसी को भी ऑडिट चलाना चाहिए?
वहाँ एक स्पष्ट हितों का टकराव है, लेकिन मुझे नहीं लगता कि यह उन्हें स्वचालित रूप से अयोग्य ठहराता है। जो महत्वपूर्ण है वह यह है कि ऑडिट के निष्कर्ष इतने स्पष्ट रूप से दस्तावेज़ित हों कि एक अलग एजेंसी उन्हें लागू कर सके। अगर ऑडिट इतना अस्पष्ट है कि केवल ऑडिट एजेंसी ही इसकी व्याख्या कर सकती है, तो यह एक समस्या है चाहे यह जानबूझकर हो या नहीं।different agency could implement them. If the audit is so vague that only the audit agency can interpret it, that's a problem regardless of whether it's intentional.
क्या हमें एंटरप्राइज ऑडिट की जरूरत है अगर हमने 18 महीने पहले एक पहले ही करवाया है?
हाँ, अगर साइट को माइग्रेशन, एक मेजर CMS चेंज, या तब से महत्वपूर्ण URL रीस्ट्रक्चरिंग से गुजरना पड़ा है। यह भी हाँ है अगर ऑर्गैनिक ट्रैफिक 20% से अधिक किसी भी दिशा में शिफ्ट हुआ है -- कुछ बदल गया है और आपको जानना चाहिए कि क्या। ऑडिट एंटरप्राइज स्केल पर एक बार की चीज नहीं हैं। बड़ी, सक्रिय साइट्स के लिए सालाना न्यूनतम है।
एंटरप्राइज़ SEO ऑडिट का सबसे नज़रअंदाज़ किया जाने वाला हिस्सा कौन सा है?
लॉग फ़ाइल विश्लेषण। हर बार। यह समय लेने वाला है, इसके लिए सर्वर एक्सेस की जरूरत होती है जो क्लाइंट कभी-कभी देने में असहज होते हैं, और निष्कर्ष Core Web Vitals ग्राफ़ जितने विज़ुअली आकर्षक नहीं होते। लेकिन यह Googlebot के दिमाग को पढ़ने की सबसे क़रीबी चीज़ है जो आप पाएंगे। कोई भी गंभीर एंटरप्राइज़ ऑडिट इसे छोड़ नहीं सकता।
---
उस रिटेलर की 94-पेज PDF अभी भी वह बेंचमार्क है जिसके विरुद्ध मैं सब कुछ मापता हूँ। अगर आपके ऑडिट में प्रायोरिटाइज्ड फिक्स लिस्ट, असली क्रॉल बजट डेटा, और लॉग फाइल एनालिसिस नहीं है, तो आपने ऑडिट नहीं पाया है। आपने एक रिपोर्ट पाई है। अंतर है, और यह सही चीज की माँग करने के लिए बहस के काबिल है।
