بررسی ارور های سرچ کنسول: آموزش رفع خطاهای سایت

  • نویسنده: محسن لشکری
  • بازبینی شده توسط: داود قربانی
  • بروزرسانی:
  • https://darkoobedu.ir/?p=8435
بررسی ارور های سرچ کنسول: آموزش رفع خطاهای سایت

همانطور که می دانید، گوگل سرچ کنسول یک بخش ضروری از جعبه ابزار سئو هر وبسایتی است.

ما در این مقاله قصد داریم بر مراحل کرال و ایندکس کردن گوگل تمرکز کنیم. همچنین می خواهیم خطاهای مختلفی را که ممکن است در قسمت coverage گوگل سرچ کنسول خود پیدا کنید، پوشش دهیم. مهمتر از آن، ما به شما اطلاعاتی در مورد نحوه رفع آنها خواهیم داد.

قبل از اینکه به بررسی ارورهای سرچ کنسول بپردازیم بهتر است با عبارات و اصطلاح هایی که در ادامه زیاد راجب آنها صحبت میکنیم آشنا شوید:

کرال و ایندکس موتورهای جستجو: کرال (crawl) یک فرایند در موتورهای جستجو است که توسط ربات ها یا اسپایدرها انجام میشود. در این فرایند ربات ها، وب سایت ها و صفحات وب را به صورت خودکار میگردند و اطلاعات مختلفی را از آنها استخراج میکنند. این اطلاعات شامل متن، لینک ها، تصاویر و سایر محتویات صفحات وب است.

به مرحل بعدی از فرایند جستجو ایندکس (index) میگویند. بعد از اینکه ربات ها صفحات را خزیدند (کرال کردند) و اطلاعات را جمع آوری کردند آنها را در پایگاه داده ای بنام ایندکس ذخیره میکنند. این ایندکس اطلاعاتی جامع از تمام صفحات وب است که موتورهای جستجو برای نشان دادن نتایج جستجو از آن استفاده میکنند. وقتی کاربر عبارتی را سرچ میکند موتور جستجو ازاین ایندکس برای جواب دادن به جستجو استفاده میکند.

به عبارت دیگر کرال مسئول جمع اوری اطلاعات و ایندکس مسئول مرتب سازی و نگهداری اطلاعات جهت امکان جستجوی سریع تر و دقیق تر در وب میباشد.کرال و ایندکس موتورهای جستجوکرال و ایندکس موتورهای جستجو

نقشه سایت:  نقشه سایت (Sitemap) صفحه ای است که فهرست کاملی از تمام صفحات موجود در وبسایت را شامل میشود و خزنده های موتور جستجو به کمک ان میتوانند محتوای وبسایت را ببیند و آنها را ایندکس کنند. بنابراین اگر بخواهیم صفحه ای ایندکس نشود لینکش را از سایت مپ هم حذف میکنیم.

sitemap

ریدایرکت: ریدایرکت به معنای انتقال کاربر به آدرس و صفحه جدید است. این عملیات معمولا با استفاده از کدهای مخصوصی مانند 301 (ریدایرکت دائمی) و 302 (ریدایرکت موقت) انجام میشود. درواقع از ریدایرکت ها برای انتقال کاربران از ادرس های قدیمی به ادرس های جدید یا صفحات جایگزین استفاده میشود.

ریدایرکت

robots.txt: یک فایل robots.txt حاوی دستورالعمل هایی برای موتورهای جستجو است. می‌توانید از آن برای جلوگیری از ایندکس موتورهای جستجو در بخش‌های خاصی از وب‌سایت‌تان استفاده کنید و به موتورهای جستجو نکات مفیدی در مورد اینکه چگونه می‌توانند وب‌سایت شما را به بهترین نحو کرال و ایندکس کنند، بدهید.

فایل robots.txt

خطا Server error (5xx) در سرچ کنسول

اگر گوگل یک خطای سرور را به شما نشان می‌دهد، به این معنی است که چیزی مانع از دسترسی کاربران و ربات های گوگل به صفحه برای خزیدن و رتبه‌بندی آن می‌شود. به طور کلی، سه نوع مختلف از خطاهای سرور وجود دارد.

500: 500 یک “خطای سرور داخلی” است به این معنی که مشکلات فنی باعث می شود سرور پردازش درخواست را به تاخیر بیاندازد. این می تواند به دلایل مختلفی باشد. ممکن است مشکل کدنویسی در CMS شما، کد PHP نامناسب در وب سایت شما یا دلیل دیگری وجود داشته باشد.

502: خطاهای 502 نشان دهنده خطاهای “bad gateway” هستند. این بدان معناست که درخواست شما به دلیل پاسخ ندادن سرویس بالادستی به تاخیر افتاده است. بالادست ممکن است روی یک ماشین یا یک ماشین کاملاً متفاوت در حال اجرا باشد. به طور کلی، اگر با خطای 502 مواجه شدید، این خطا در CMS شما مانند وردپرس است.

503: خطاهای 503 خطاهای «سرویس در دسترس نیست» یا ‘service unavailable’ هستند. این بدان معنی است که سرور خیلی شلوغ است، برای تعمیر و نگهداری یا به طور کامل از کار افتاده است و دسترسی گوگل بات ها به سایت خیلی طول می کشد. ربات گوگل فقط مدت زمان مشخصی را منتظر می ماند تا تسلیم شود و یک خطای 5xx ارائه دهد.

برای اینکه  گوکل بات ها بتوانند سایت شما را بخزند و این این ارور برطرف شود ابتدا باید تعیین کنید که آیا خطای سرور یک خطای 500، یک خطای 502 یا یک خطای 503 است. این خطایی است که باید به شرکت هاستینگ یا تیم آیتی شرکت پیام داده و از آنها بخواهید که مشکل مورد نظر را حل کنند.

خطا Redirect error  در سرچ کنسول

گوگل گاهی اوقات با تغییر مسیر در وب سایت شما با مشکل مواجه می شود. این یکی از رایج ترین خطاهای موجود در سرچ کنسول است. خوشبختانه، این نوع ارور ها به طور کلی ساده ترین ارورها برای تعمیر هستند.

انواع مختلفی از خطاهای ریدایرکت وجود دارد:

حلقه‌های تغییر مسیر (Redirect loops): حلقه تغییر مسیر یک زنجیره تغییر مسیر است که به URL اصلی که می‌خواهید تغییر مسیر دهید ختم می‌شود و زنجیره را دوباره شروع می‌کند. برای مثال، اگر می‌خواستم https://www.website.com/originalURL را به https://www.website.com/redirectedURL هدایت کنم، اما در زنجیره، دوباره به URL اصلی رسیدم، گوگل به عقب برمی‌گردد. به این URL و زنجیره دوباره شروع می شود.

زنجیره های تغییر مسیر (redirect chain): قبلاً در مورد این واقعیت صحبت کردیم که Googlebot در صورتی که پاسخگویی به سرور خیلی طول بکشد، منصرف می‌شود. زمانی که با زنجیره تغییر مسیر سر و کار دارد، همینطور است. اگر زنجیره تغییر مسیر بیش از حد طولانی باشد و ربات گوگل خیلی طول بکشد تا به URL نهایی برسد، تسلیم می شود و خطایی ایجاد می کند.

URL های “بد” یا خالی در زنجیره تغییر مسیر: اگر URL وجود داشته باشد که به هر دلیلی در زنجیره تغییر مسیر کار نمی کند، Googlebot خطا می کند. این می تواند یک 404 (که بعداً در مورد آن صحبت خواهیم کرد) یا یک URL خالی باشد. مهم نیست. اگر Googlebot نتواند به URL در زنجیره تغییر مسیر دسترسی پیدا کند، این خطا به شما داده می شود.

URL نهایی بیشتر از حداکثر طول آدرس، اندازه داشته باشد: به زبان ساده، URL ها دارای طول نویسه ای هستند که باید به آن پایبند باشند. اگر این اتفاق بیفتد، Googlebot این URL را نمی‌خزد و با خطا مواجه می‌شوید. همیشه باید اطمینان حاصل کنید که URL های خود را در صورت امکان کوتاه کنید.

برای رفع خطای ریدایرکت، هر دلیلی که باشد، باید URL ریدایرکت اصلی و URL نهایی را پیدا کنید. درواقع، شما باید URL را که می خواهید تغییر مسیر دهید و URL را که می خواهید URL را به آن تغییر مسیر دهید پیدا کنید.

می توانید این کار را با استفاده از ابزار کرال سایت مانند ScreamingFrog یا Sitebulb انجام دهید. اینها همچنین دارای ابزارهای مفیدی هستند که به شما در رفع خطاهای ریدایرکت کمک می کنند.

استفاده از این ابزارها به شما این امکان را می دهد که کل مسیر تغییر مسیر را ببینید و پاکسازی کنید.اگر می توانید، سعی کنید زنجیره های تغییر مسیر را به حداقل برسانید و برای سهولت یک URL را به URL نهایی هدایت کنید. 

خطا URL blocked by robots.txt در سرچ کنسول

این خطا به این معنی است که Googlebot از دسترسی به صفحه یا صفحات خاصی در وب سایت شما توسط فایل robots.txt  جلوگیری می کند. اساساً، فایل robots.txt شما مانع از خزیدن گوگل بات ها در صفحه می شود.

دو دلیل رایج برای این اتفاق وجود دارد. اولا، ممکن است فایل robots.txt خود را به اشتباه پیکربندی کرده باشید. ممکن است به طور تصادفی Googlebot را از دسترسی به صفحه خاصی مسدود کرده باشید. اگر افزونه های سئو مانند Yoast یا RankMath داشته باشید، این می تواند در وردپرس زیاد اتفاق بیفتد.

همچنین ممکن است آدرس صفحه ای از سایت شما در نقشه سایت وجود داشته باشد اما به کمک افزونه های وردپرس، کدنویسی دستی و… در فایل robots.txt به گوگل گفته باشید که صفحه مورد نظر را بررسی نکند.

برای رفع این مشکل، باید یک نسخه از robots.txt خود را دانلود کنید و URL مسدود شده را جستجو و پیدا کنید. ممکن است کل URL در آنجا باشد، اگر اینطور باشد، پس از اجرای جستجو نشان داده می شود.  اگر URL کامل شما نمایش داده نشد، یک پیشوند را امتحان کنید زیرا ممکن است فایل robots.txt شما بخشی URL را که شامل این صفحه است مسدود کند.

هنگامی که صفحه خود را در فایل robots.txt خود پیدا کردید، اگر میخواهید صفحه توسط گوگل دیده شود، آن را از حالت نوایندکس در فایل ربات دربیاورید. اما اگر نمیخواهید آن صفحه ایندکس شود می توانید آن را حذف کرده و در آخر فایل را دوباره آپلود کنید.

خطا URL marked ‘noindex’ در سرچ کنسول

اگر یک URL با علامت خطای ‘noindex’ مشاهده می کنید، به این معنی است که Google صفحه ای را شناسایی کرده است که که به گوگل گفته اید ان را ایندکس کند اما چیزی از ایندکس کردن صفحه توسط گوگل جلوگیری کرده است

دو دلیل احتمالی برای این وجود دارد. یا یک متا تگ noindex در HTML صفحه وجو دارد و یا یک هدر HTTP X-Robots-Tag. Googlebot این موارد را دیده است و نمی تواند صفحه شما را ایندکس کند.

اگر با این خطا مواجه شدید، به کد منبع صفحه خود نگاهی بیندازید و ببینید که آیا می‌توانید متا تگ noindex یا X-Robots-Tag را که noindex را نشان می‌دهد پیدا کنید و آن را حذف کنید.  سپس URL را مجدداً از طریق سرچ کنسول برای گوگل ارسال کنید.

خطا Soft 404 در سرچ  کنسول

همانطور که احتمالا میدانید صفحه 404 آن صفحهاتی از سایت هستند که وقتی میخواهید واردش بشوید با ارور 404 روبرو میشوید. 

چند دلیل برای این ارور وجود دارد. این عمدتا زمانی اتفاق می افتد که از یک CMS مانند وردپرس استفاده می کنید. هنگامی که یک برچسب در وردپرس ایجاد می کنید، یک URL جدید به طور خودکار ایجاد می شود که گوگل می تواند آن را پیدا کند. به خصوص اگر به صورت خودکار به نقشه سایت اضافه شود. Googlebot این را می بیند و آن را می خزد (به دلیل اینکه یک URL کار می کند) اما می بیند که محتوایی وجود ندارد. تصمیم می گیرد که این برای کاربر مفید نیست و این خطا را ننشان میدهد.

اگر این اتفاق بیفتد، ابتدا باید بدانید که چرا صفحه‌ای بدون اطلاعات به کاربران نشان داده می‌شود (در صورتی که مشکل برچسب وردپرس باشد، همانطور که در بالا ذکر شد، انجام آن آسان است) و با حذف کامل URL یا افزودن محتوای مفید به صفحه، آن را برطرف کنید. و هر عبارت 404 را از صفحه حذف کنید.

خطا Blocked due to unauthorised request (401) در سرچ  کنسول

این خطا به این معنی است که Googlebot از دسترسی به صفحه برای خزیدن، فهرست‌بندی و رتبه‌بندی آن مسدود شده است. چه کاربران بتوانند بدون مشکل به صفحه دسترسی داشته باشند یا نه، ممکن است این اتفاق بیفتد.

شایع ترین دلیل نشان دادن این خطا این است که وب سایت شما بات های گوگل را از خزیدن در صفحه مسدود می کند، به احتمال زیاد به دلیل فایروال یا سیستم های داخلی سایت شما که Googlebot را مسدود می کند. این ممکن است در هنگام خزیدن سایت نیز اتفاق بیفتد. اگر به خزنده سایت (مانند ScreamingFrog یا Sitebulb) اجازه نمی دهید، خطای مشابهی را مشاهده خواهید کرد.

برای رفع این مشکل، باید علت مسدود شدن ربات گوگل را پیدا کرده و آن را حذف کنید. اغلب می توانید این کار را با رفتن به تنظیمات فایروال خود انجام دهید.

خطا Blocked due to access forbidden (403) در سرچ  کنسول

هنگامی که در یک وب سایت کد 403 به شما نشان داده می شود، ممکن است سه دلیل وجود داشته باشد:

  • سرور شما درخواست را درک کرده و می داند که صفحه را می توان در کجا پیدا کرد.
  • مرورگرها (یا خزنده ها) درخواست کننده برای دسترسی به آن صفحه خاص نیاز به مجوز دارند.
  • سرور شما درخواست را رد کرد زیرا اعتبارنامه ارائه شده ضمانت اعطای مجوز مناسب را نداشته.

وقتی ربات های گوگل از صفحه ای بازدید می کند تا آن را کرال کنند، در هنگام درخواست، هیچ اعتبار دسترسی را ارائه نمی دهد. اگر کد 401 را می‌بینید، می‌دانید که به این دلیل است که Googlebot مجوزهای مناسب را همانطور که در بالا توضیح دادیم اعطا نشده است.

اگر کد 403 را می بینید، ممکن است به دلایل زیر باشد:

خطا در فایل htaccess شما: در این صورت باید این فایل معیوب را غیرفعال کنید و یک فایل جدید بسازید.
پلاگین های وردپرس معیوب: اگر اینطور است، باید پلاگین های خود را یکی یکی غیرفعال کنید تا زمانی که پلاگین را که باعث خطای 403 شده است را پیدا کنید و سپس افزونه را به جدیدترین نسخه نصب کنید تا ببینید آیا با این کار مشکل برطرف می شود یا خیر.
آدرس ip اشتباه است: اگر نام دامنه شما به آدرس IP اشتباه اشاره کند، ممکن است خطای 403 رخ دهد. برای رفع این مشکل، رکورد A خود را با ارائه دهنده دامنه خود تأیید کنید.
 بدافزارها: اگر هیچ یک از موارد بالا دلیل خطاهای 403 شما نیست، ممکن است به بدافزار آلوده شده باشید. اگر چنین است، وب سایت خود را برای علائم بدافزارها اسکن کنید.

خطا Not found (404) در سرچ  کنسول

اگر با خطای 404 مواجه شدید، به این معنی است که بات های گوگل سعی کرده اند URL را که دیگر وجود ندارد را بخزند.

کمی قبلتر در مورد خطای 404 soft صحبت کردیم، اما این ارور کمی جدی تر است. این خطا بدان معناست که URL تغییر کرده است و هیچ تغییر مسیر یا ریدایرکتی اجرا نشده است، یا به این معنی است که URL به سادگی دیگر وجود ندارد.

اگر این کد خطا به شما نمایش داده می شود، ابتدا باید یک کرال را در وب سایت خود اجرا کنید و نقشه سایت خود را تجزیه و تحلیل کنید تا مواردی را پیدا کنید که آن URL قدیمی را نشان میدهد. هنگامی که این موارد را پیدا کردید، اگر واقعاً URL ها از سایت شما حذف شده اند می توانید انها را از وب سایت و نقشه سایت خود حذف کنید.

اگر این خطا به دلیل عدم وجود ریدایرکت در یک URL قدیمی ایجاد شده است، باید قبل از خزیدن مجدد URL از طریق سرچ کنسول، اطمینان حاصل کنید که ریدایرکت به یک صفحه مرتبط یا اصلا صفحه اصلی سایت انجام شده.

سپس آدرس آن را از سایت مپ خارج کنید. می توانید این کار را به صورت دستی یا با استفاده از افزونه ای مانند Yoast یا RankMath در صورت استفاده از وردپرس انجام دهید.

خطا URL blocked due to other 4xx issue در سرچ  کنسول

این خطا به این معنی است که وب سایت شما با خطای 4xx دیگری از فهرست بندی مسدود شده است. ابتدا باید با مراجعه به URL به صورت دستی متوجه شوید که کدام کد داده می شود.

خطای 404: همانطور که قبلا گفته شد، این بدان معناست که بات های گوگل سعی کرده اند URL را که دیگر وجود ندارد بخزند.
خطای 400: خطای 400 زمانی رخ می دهد که سرور قادر به پردازش درخواست نباشد. عمدتاً به دلیل از کار افتادن یک وب سایت برای تعمیر و نگهداری یا وجود خطا در کد صفحه.
خطای 403: این خطا زمانی رخ می دهد که دسترسی به وب سایت محدود شود. اگر وب سایت با رمز عبور محافظت شده باشد یا در پشت دیوار پرداخت باشد، ممکن است این اتفاق بیفتد.

هنگامی که به درستی تشخیص دادید کدام کد 4xx برای هر URL ایجاد شده است، می توانید ادامه دهید و هر URL را بر اساس کد صحیح اصلاح کنید.

اگر کد 404 ایجاد شده باشد، ریدایرکت ها یا حذف URL ها از وب سایت و نقشه سایت خود را انجام دهید.

در صورت بروز خطای 400 (اگر وب‌سایت برای تعمیر و نگهداری برنامه‌ریزی‌شده از کار افتاده نباشد) هر گونه خطا در کد خود را پیدا کرده و رفع کنید.

هر گونه عملکرد دیوار پرداخت را حذف کنید تا گوگل بات ها بتوانند URL هایی را که خطای 403 دریافت کرده اند بخزند.

خطا Blocked by ‘Page Removal Tool’ در سرچ کنسول

ابزار removal tool در سرچ کنسول به مدیران وبسایت این امکان را میدهد که یک یا چند صفحه و یا حتی کل وبسایت را از دید گوگل به صورت موقتی حذف کنند. در واقع این ابزار صفحات انتخابی را موقتا noindex کرده و پس از مدتی معلوم دوباره صفحه index میشود.

بنابراین اگر به صفحه ای در وب سایت نیاز ندارید به کمک تگ noindex یا فایل ربات آن را noindex کنید و یا آن را حذف یا ریدایرکت کنید.

خطا Crawled – Currently Not Indexed در سرچ کنسول

دیدن این خطا توسط سرچ کنسول بسیار آزاردهنده است زیرا به این معنی است که گوگل بات ها توانسته اند این صفحات را بدون مشکل بخزند، اما تصمیم گرفته اند فعلاً آن را ایندکس نکنند، به این معنی که هر URL با این خطا در SERP های گوگل نمایش داده نمی شود و رتبه بندی نمیشود.

این بدان معناست که آن صفحه، به هر دلیلی، کیفیت مورد نظر گوگل برای رتبه بندی را ندارد. خوشبختانه، چند کار وجود دارد که می توانید برای رفع این مشکل انجام دهید.

  • می توانید لینک های داخلی بیشتری به صفحه اضافه کنید. لینک ها نشانگر authority و اعتبار برای گوگل هستند، بنابراین افزودن لینک های بیشتر (چه داخلی و چه خارجی) به یک صفحه تضمین می‌کند که گوگل آن را دارای اعتبار بیشتری می‌داند. بک لینک های خارجی به طور کلی معتبرتر دیده می شوند، اما لینک های داخلی هنوز هم مفید هستند.
  • محتوای صفحه را بررسی کنید. آیا کم است؟ از کیفیت پایین برخوردار است؟ شما می توانید به سادگی با افزودن محتوای با کیفیت بیشتر به صفحه، صفحه را به فهرست گوگل اضافه کنید.
  • آیا محتوای صفحه با هدف جستجوی کلمات کلیدی که می خواهید رتبه بندی کنید مطابقت دارد؟ در غیر این صورت، محتوای صفحه را تغییر دهید تا بهتر با هدف جستجوگران مطابقت داشته باشد.

خطا Discovered – Currently Not Indexed در سرچ کنسول

این خطا در سرچ کنسول به این معنی است که گوگل می داند که این صفحه وجود دارد اما هنوز انها را کرال و ایندکس نکرده است. این موضوع می تواند به دلایل مختلفی باشد مثل ساختار ضعیف وبسایت، محتوای ضعیف، دلایل فنی و..

برای حل این مشکل می توانید URL را به صورت دستی ارسال کنید تا توسط گوگل خزیده شود. می توانید این کار را با سرچ URL در نوار بالای سرچ کنسول و کلیک بر روی دکمه “Request Indexing” انجام دهید:

Request Indexing

همچنین چک کنید که آیا صفحه در نقشه سایت شما گنجانده شده است یاخیر. اگر نه، و می خواهید صفحه ایندکس شود، باید URL را به نقشه سایت خود اضافه کنید.

خطا Alternate page with proper canonical tag در سرچ کنسول

این خطا به این معنی است که گوگل یک صفحه که کپی از صفحه دیگری است را مشاهده کرده، اما خوده گوگل با کمک تگ کنونیکال صفحه اصلی را شناخته است. اگر واقعاً نمی خواهید این صفحه ایندکس شود از نظر فنی این یک خطا نیست.

با این حال، اگر می خواهید صفحه ایندکس شود، کمی کار بیشتری برای انجام دادن وجود دارد. ابتدا باید تگ canonical را حذف کنید و بگذارید تا صفحه دوباره کرال شود تا ببینید آیا این مشکل را حل می کند یا خیر. گاهی اوقات این به خوبی کار می کند و گاهی اوقات به شما خطای دیگری مانند “Duplicate without user-selected canonical” داده می شود که در ادامه در مورد آن صحبت خواهیم کرد.

اگر متوجه شدید که URL شما حتی پس از حذف تگ کنولیکال ایندکس نمی شود، باید محتوای صفحه را تغییر دهید تا گوگل دیگر آن را تکراری نبیند. می‌توانید این کار را با افزودن و/یا حذف محتوای خاص، افزودن ویدیو، یا تطبیق بهتر صفحه با هدف جستجو انجام دهید.

خطا Duplicate without user-selected canonical در سرچ کنسول

اگر این خطا به شما نشان داده شد، به این معنی است که گوگل صفحاتی تکراری در وب سایت شما مشاهده کرده است. این ممکن است در وب سایت های بزرگ، به خصوص وب سایت های بزرگ، زیاد اتفاق بیفتد! بنابراین مهم است که برای تمام صفحات تکراری خود به درستی از تگ کنولیکال استفاده کنید تا گوگل را از گمراهی دراورید.

تگ canonical یک عنصر HTML است که اگر محتوای تکراری در وب سایت خود دارید می توانید از آن برای اینکه گوگل را به نسخه متعارف محتوای تکراری خود راهنمایی کنید، استفاده کنید. استفاده از این تگ احتمال این که گوگل آن نسخه را رتبه بنندی و ایندکس کند را بیشتر می کند.

ابتدا مشخص کنید که کدام صفحه را می خواهید در فهرست گوگل نشان داده شود و مطمئن شوید که با تگ کنولیکال به خودش اشاره می کند. این به عنوان یک self-referencing canonical نامیده می شود. در این مورد کمی بعدتر صحبت خواهیم کرد.

در مرحله بعد، هنگامی که صفحه ای را که باید ایندکس شود ایجاد کردید و یک تگ self-referencing canonical اضافه کردید، باید تمام صفحات تکراری را پیدا کنید و به آنها یک تگ کنولیکال به صفحه ای که می خواهید ایندکس شود بدهید. شما می توانید این صفحات را در Google Search Console report شناسایی کنید، همچنین میتوانید از ابزارهایی مانند ScreamingFrog، OnCrawl یا Sitebulb استفاده کنید.

هنگامی که به همه صفحات تگ کنولیکال صحیح داده شد، از گوگل بخواهید با استفاده از ابزار دستی که گفته شد دوباره صفحات شما را کرال کند.

خطا Duplicate, Google chose different canonical than user در سرچ کنسول

این خطا به این معناست که محتوای تکراری در سایت خود دارید و گوگل صفحات مقصد کنولیکالی متفاوت از آنچه شما انتخاب کرده‌اید انتخاب کرده است. در واقع نظر گوگل درباره صفحه مقصد کنونیکال و اینکه کدام صفحه باید ایندکس شود با شما یکی نیست.

اگر صفحه ای که ایندکس می شود صفحه درستی است و شما با گوگل موافق هستید، از نظر فنی، نیازی به انجام کاری در اینجا ندارید. با این حال، بهتر است برای جلوگیری از نمایش این خطا در کنسول جستجوی گوگل، در این صفحه به صفحه ای که گوگل میگوید یک تگ کنونیکال بزنید.

اگر صفحه ای که ایندکس می شود صفحه اشتباهی است، باید به صفحات خود تگ کنونیکال را به درستی اضافه کنید. و سئو صفحات مورد نظر را بهبود دهید.

هشدار Indexed, though blocked by robots.txt در سرچ کنسول

این هشدار به این معناست که صفحات حتی با وجود مسدود شدن در فایل ربات، باز هم ایندکس شده اند. هنگامی که این اتفاق می افتد،آن صفحه در نتایج SERP بدون توضیح متا نشان داده می شود. بدون توضیح متا نشان داده می شود زیرا گوگل اجازه نداشته برای دیدن توضیحات متا در صفحه بخزد.

Indexed, though blocked by robots.txt

چند راه حل مختلف برای این وجود دارد، اما ابتدا باید مشخص کنید که آیا می خواهید صفحه ایندکس شود یا خیر.

اگر نمی خواهید صفحه ایندکس شود، می توانید یک تگ noindex را مستقیماً به صفحه خود اضافه کنید. اما شما باید به گوگل اجازه دهید تا صفحه را بخزد تا بتواند تگ noindex را ببیند.

اگر صفحه دیگری وجود دارد که همان کلمات کلیدی را هدف قرار می دهد و محتوای تقریبا مشابهی دارد، می توانید یک تگ کنونیکال ازاین صفحه به  صفحه مشابه اضافه کنید. همچنین می توانید سعی کنید تمام لینک های داخلی صفحه را حذف کنید، صفحه را با رمز عبور محافظت کنید یا آن را حذف کنید و اجازه دهید 404 باشد.

اگر می خواهید صفحه ایندکس شود، فایل ربات را بررسی کرده و اگر تگ نوایندکس پیدا کردید، آن را اصلاح کنید. 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

چطور می تونم کمک کنم؟
مشاوره آنلاین