لطفا اموزشی قرار بدهید برای حل خطاهای گوگل کنسول با تشکر!
رفع خطاهای گوگل کنسول چگونه است؟
- 156
- 1400/7/24
یکی از قابلیتهای بسیار کاربردی سرچ کنسول گوگل، گزارش Index Coverage است. این قابلیت(که از طریق منوی سمت راست سرچ کنسول قابل دسترسی است) فهرستی از همه صفحاتی که گوگل برای مرور و ایندکس کردن آنها تلاش کرده به همراه خطاهای احتمالی که در این مسیر با آنها مواجه شده است را به شما نشان میدهد.
صفحه گزارش Index Coverage
در بخش coverage سرچ کنسول شما با 4 وضعیت مختلف مواجه هستید. در بالای نمودار چهار مستطیل کوچک قرار دارد که بهطور پیشفرض، اولی به رنگ قرمز است. درواقع، رنگی بودن هر یک از این مستطیلها به معنی فعال بودنش و نمایش گزارش نموداری آن در نمودار ستونی زیرش است. در واقع اطلاعات مربوط به هر یک از این موارد به طور دقیق و با جزئیات قرار گرفت است که برای رفع خطاهای گوگل سرچ کنسول میتوان از آنها بهره برد. در ادامه به معرفی هر یک از این قستها و انواع خطاهای موجود در آنها میپردازیم.
بخشهای مختلف صفحهی Coverage
- Error (باکس قرمز): در این بخش صفحاتی نشان داده میشوند که به دلیل وجود مشکل یا شاید چندین مشکل ایندکس نشدهاند.
- Valid with warnings(باکس زرد): صفحاتی که در این بخش قرار میگیرند، صفحاتی هستند که اگرچه ایندکس شدهاند اما ایراد یا مسئلهای در آنها شناسایی شده که گوگل نسبت به صحت تشخیص خود یا عمدی و غیرعمدی بودن مشکل مزبور اطمینان ندارد. پس بهتر است که در مورد این صفحات هم اطلاعات کاملتری جمع آوری کنید.
- Valid(باکس سبز): این صفحات مشکلی ندارند و با موفقیت ایندکس شدهاند.
- Excluded(باکس خاکستری): کلمه Excluded به معنی مستثنا شده است. اینها صفحاتی هستند که ظاهراً خودتان آنها را از ایندکس شدن مستثنا کردهاید. طبیعتاً این صفحات در نتایج جستجو ظاهر نخواهند شد. به عنوان مثال ممکن است لینک مشخص شده یک نسخه تکراری از صفحه کانونیکال باشد که پیشتر توسط گوگل ایندکس شده است.
-
حتما توجه داشته باشید که هر یک از حالتهای مشخص شده Error ،Warning و Excluded به دلایلی اتفاق افتادهاند. به همین دلیل باید به خوبی نسبت به دلیل آن آگاهی پیدا کنید و در جهت رفع آنها حرکت کنید. با کلیک بر روی هر کدام از این مستطیلها که به اختصار معرفی شدند، نمودار مربوط به آن فعال میشود. ضمن اینکه در قسمت پایین هم صفحات مرتبط با آن بهصورت موضوعی فهرست میشوند.
در ادامه مقاله تلاش داریم به شرح هر یک از هشدارها و خطاهای سرچ کنسول گوگل بپردازیم و البته سعی کردهایم آنچه که برای رفع آنها باید انجام بدهید را هم توضیح دهیم.ضمناً پس از کسب اطمینان از اینکه مشکل مورد نظر حل شده است، با استفاده از فرآیند تعبیه شده در گوگل سرچ کنسول میتوانید حل شدن آن را به گوگل اطلاع دهید. این مراحل را نیز در انتهای این مطلب شرح میدهیم.
بخش Error در صفحهی Coverage سرچ کنسول
بخش Error سرچ کنسول گوگل
همان طور که در تصویر بالا قابل مشاهده است، این بخش شامل چندین ستون است که در هر کدام از این ستونها، اطلاعات مخصوصی راجع به Error به کاربر ارائه میگردد. در ادامه به معرفی هر یک از این ستونها پرداخته شده است:
- ستون status: در این ستون میبینیم که اینها، Errorهای بخش Coverage هستند.
- ستون type: در این ستون نوع Error نمایش داده شده است. در ادامه به شرح مفصل تمام Errorها خواهیم پرد اخت.
- ستون validation: این ستون مربوط به بخش اعتبارسنجی است.
- ستون Trend: در این ستون روند خطاها را میتوانیم مشاهده کنیم.
- ستون Pages: تعداد کل صفحاتی که مشمول این Error هستند را میتوانیم در این ستون مشاهده کنیم.
انواع Errorها در صفحهی Coverage سرچ کنسول گوگل
- Server error: این خطا که با عنوان خطای 500 نیز شناخته میشود جزو خطاهاییاست که کد سهرقمی خطای آنها با «5» شروع میشود. در واقع خطای 500 به این معنی است که اشکالی در رابطه با سرور سایت شما پیشآمده که مانع پذیرش درخواست کاربر برای بارگذاری صفحه مورد نظر شده است. در اینجا یک ایراد سروری سبب شده که گوگل نتواند صفحه مورد نظر را بارگذاری و ثبت یا «ایندکس» نماید. اما اگر بخواهیم به شکل مختصر و مفید بگوییم که مسیر حل این مشکل چگونه است باید ابتدا صفحهای که گوگل وجود خطای 500 را در آن گزارش کرده است را در مرورگر خود باز کنید و ببینید که آیا بارگذاری انجام میشود یا خیر. اگر صفحه بارگذاری شد، احتمالاً مشکل موقتی بوده و حل شده است اما در هر صورت با شرکت میزبان یا تیم آی تی شرکت تماس بگیرید و در مورد قطعی سرور یا مشکلات احتمالی آن در روزهای اخیر و همچنین در رابطه با تنظیماتی که احتمالاً مانع دسترسی گوگل بات و سایر رباتها به سایت میشود را از آنها پیگیری کنید.
- Redirect error: این Error یعنی خطای تغییر مسیر وجود دارد. تغییر مسیر موجود برای آدرس مورد نظر اشکال دارد و احتمالاً دلیل مشکل، یکی از این موارد است: دنبالهای از تغییر مسیرهای متوالی وجود داشته که بیشازحد به درازا کشیده شده است، صفحه بهطور بیپایان تغییر مسیر میدهد، تعداد کاراکترهای آدرس تغییر مسیر داده شده در نهایت از تعداد مجاز فراتر رفته است و یا یک آدرس اشتباه یا خالی در زنجیره تغییر مسیرها وجود دارد. گوگل باید حجم انبوهی از محتوا را بررسی کند بنابراین علاقهای به هدر دادن وقت و انرژی برای مرور چنین لینکهایی ندارد. برای حل این مشکل اطمینان حاصل کنید که تغییر مسیر مورد نظر مستقیماً کاربر را به آدرس نهایی راهنمایی کند و هیچ مرحله دیگری در این میان وجود نداشته باشد.
- Submitted URL blocked by robots.txt: علت ایجاد این خطا این است که شما تقاضای ایندکس کردن این صفحه را داشتهاید اما دسترسی به آن توسط فایل robots.txt محدود شده است. صفحه مورد نظر را با استفاده از robots.txt tester گوگل، تست و بررسی کنید.
- Submitted URL marked noindex: شما درخواست کردهاید که این صفحه ایندکس شود اما در تگ متای آن صفحه یا یک HTTP response ، یک دستور noindex قرار دارد. اگر تمایل به ایندکس شدن صفحه مورد نظر دارید، باید تگ یا HTTP response مزبور را حذف کنید. اگر بخواهیم به زبان سادهتر بیان کنیم، دلیل اعلام این خطا از سوی گوگل این است که شما برای گوگل پیامهای متناقضی را ارسال کردهاید. از یک طرف دستور میدهید که ایندکس کند اما از سوی دیگر از گوگل میخواهید که ایندکس نکند! برای حل این مشکل به سراغ کدهای صفحه مورد نظر بروید و دنبال کلمه noindex در آنها بگردید. اگر این کلمه را پیدا کردید به نرمافزار مدیریت محتوای سایتتان(مثلاً وردپرس) مراجعه کرده و به دنبال تنظیماتی باشید که این دستور را حذف میکند یا اینکه مستقیماً کدهای آن صفحه را ویرایش نمایید.
- Submitted URL seems to be a Soft 404: وقتی که شما URL یک صفحه که دارای خطای Soft 404 است را ایندکس کنید، در بخش error سرچ کنسول گوگل با این خطا مواجه میشوید. soft 404 یکی از خطاهای سرچ کنسول است که تقریبا پیچیده میباشد و شناخت دقیق آن میتواند کمی دشوار باشد. برای حل مشکل soft 404 باید برای این صفحات، 404 صحیح تعریف شود یا آنها را به صفحات جدیدی تغییر مسیر بدهید(redirect) و یا اینکه در آنها محتوا قرار بدهید.
- Submitted URL returns unauthorized request 401: شما درخواست ایندکس شدن این صفحه را دارید اما گوگل با خطای دسترسی بدون مجوز(خطای 401) مواجه شده است. برای اینکه این مشکل مرتفع شود باید محدودیتهای تعیینشده برای این صفحه را حذف کنید یا دسترسیهای لازم را برای ربات گوگل فراهم کنید.
- Submitted URL not found 404: زمانی چنین خطایی را مشاهده میکنید که یک صفحه از وبسایتتان را حذف کرده باشید اما همچنان در سایتمپ Sitemap سایت وجود داشته باشد. برای جلوگیری از رخ دادن این خطا باید سایتمپ وبسایت را همزمان و همگام با تغییرات سایت، مرتباً بروزرسانی کنید.
- Submitted URL has crawl issue: شما درخواست ایندکس شدن این صفحه را دارید اما گوگل در هنگام بررسی و ثبت این صفحه با خطایی مواجه شده که دلیل آن در قالب خطاهای معمول قابلتعریف نبوده است. برای رفع این خطا باید لینک مورد نظر را در URL inspection جستجو کنید تا ببینید که تحلیل گوگل از خطای موجود چیست و چه راه حلی را برای رفع آن به شما ارائه میکند.
بخش warning سرچ کنسول
هشدارها در سرچ کنسول به اندازه خطاهای سرچ کنسول جدی نیستند اما باز هم نباید آنها را نادیده بگیرید و بهتر است که توجه لازم را به آنها داشته باشید. ایندکس شدن فهرستی که در این بخش میبینید به تصمیم گوگل بستگی دارد اما با رفع هشدارهای ذکرشده میتوانید احتمال ایندکس شدن را بالا ببرید. در این قسمت یک نوع اخطار تحت عنوان Indexed, though blocked by robots.txt مشاهده می شود.
اگر بخواهیم شرح دهیم که چرا چنین هشداری به شما از سوی گوگل داده میشود بهتر است اینگونه بگوییم که فایل robots.txt شما چیزی مانند پلیس سر چهارراه است. به برخی از رباتها مجوز عبور و مرور در سایتتان را میدهد و به بعضی دیگر اجازه نمیدهد. به کمک همین فایل میتوانید در کل وبسایت یا صفحات مورد نظرتان محدودیت دسترسی ایجاد نمایید. باید بگوییم این مورد از آن هشدارهایی است که به دفعات شاهدش هستیم. معمولاً این اشکال هنگامی بیشتر بوجود میآید که در تلاش برای مسدودسازی دسترسی یک ربات اخلالگر، قاعدهای را در فایل robots.txt تعریف میکنید که بیش از اندازه سختگیرانه محسوب میشود. به زبان دیگر، گوگل نمیتواند اطمینان بدست آورد که شما خودتان تصمیم به بلاک شدن این صفحه گرفتهاید یا این اتفاق اشتباهی رخ داده است.
بخش valid سرچ کنسول
این قسمت شامل آدرسهای معتبر یا سالم سایت شما است. صفحاتی که فهرست آنها را در این قسمت میبینید بدون هیچ مشکلی توسط گوگل ایندکس شدهاند. اگرچه در اینجا هشدار یا خطایی وجود ندارد اما گوگل برای بهتر شدن این لینکها پیشنهاداتی را به شما ارائه میدهد که برای رفع خطاهای سرچ کنسول گوگل باید به آنها هم توجه کرد:
- Submitted and indexed: شما میخواستید که این صفحه ایندکس شود و خواسته شما کاملاً و بدون مشکل انجام شده است.
- Indexed; not submitted in sitemap: صفحات مورد نظر پیدا و ایندکس شدهاند اما بهتر است بگوییم در این بین شما برای پیدا کردن آنها کمکی به گوگل نکردهاید. اگر بخواهیم توضیح واضحتری ارائه کنیم بهتر است بگوییم گوگل و سایر موتورهای جستجو ترجیح میدهند که شما آنها(موتورهای جستجو) را از طریق یک سایتمپ در جریان محتوایی که تمایل دارید ایندکس شود قرار بدهید. با این شیوه احتمال افزایش تناوب و میزان بررسی و مرور سایت بیشتر میشود که بهنوبه خود به کسب رتبههای بهتر و صد البته ترافیک بیشتر منتهی خواهد شد.
- Indexed; consider marking as canonical: این آدرس ایندکس شده است. از آنجاییکه این صفحه آدرسهای تکراری دارد پیشنهاد میشود که آدرس آن را با عنوان canonical نشانهگذاری کنید. منظور از آدرس تکراری، صفحهای است که از طریق چندین آدرس قابل دسترسی باشد. این برای سئو اتفاق خوشآیندی نیست؛ چراکه هر اعتباری که صفحه مورد نظر از طریق بک لینک بدست می آورد بین نسخههای مختلف آن تقسیم خواهد شد. ضمن اینکه، موتورهای جستجو را وادار میکنید تا با مرور آدرسهایی که درواقع یکی هستند منابع خودشان را هدر بدهند. علاوه بر همه اینها، نظم مطلوب گزارشهای آماری و تحلیلی خودتان نیز به هم خواهد خورد. اگر بخواهیم توضیح کوتاهی هم درباره تگ کنونیکال canonical بدهیم باید بگوییم که تگ canonical یک خط کد در HTML صفحه است که به موتور جستجو اعلام میکند که برای کدام نسخه از آدرس باید اولویت قائل شود و ارزش لینکها را به همان نسخه تخصیص میدهد. دقت کنید که تگ canonical باید در قسمت Head صفحه قرار گیرد.
بخش Excluded سرچ کنسول
کلمهی Excluded در این بخش به معنای مستثنا شده است. این قسمت مروبط به صفحاتیاست که خودتان تمایل به ایندکس شدن آنها را نداشتهاید و این را به اطلاع گوگل رساندهاید. البته ممکن است صفحاتی هم در این فهرست باشند که میخواهید ایندکس شوند، اما درخواست شما نادیده گرفته شده است، چرا که از نظر گوگل این صفحات به اندازه کافی ارزشمند نیستند. بنابراین اگر بخواهیم بصورت خلاصه و مشخص اعلام کنیم، باید بگوییم که URLهای موجود در این بخش در قالب دو دسته اصلی قرار میگیرند:
- صفحاتی که خودتان مشخصا از گوگل خواستهاید که آنها را ایندکس نکند.
- صفحاتی که شما قصد ایندکس کردن آنها را داشتهاید اما بنا به دلایلی از جمله تکراری بودن یا هر دلیل دیگری به نظر گوگل ارزش کافی برای ایندکس شدن را دارا نبودهاند.
جدول مربوط به اشکالات Excluded
انواع Typeها در بخش Excluded سرچ کنسول گوگل
همانطور که در تصویر بالا قابل مشاهده ست، در این بخش ما با Type های گوناگونی مواجه هستیم که هر کدامشان بنا به دلیل خاصی از طرف گوگل مورد توجه قرار گرفتهاند. در ادامه بصورت مشخص و تک به تک ، هر کدام از این Typeها را شرح و توضیح خواهیم داد:
- Blocked by ‘noindex’ tag: گوگل زمانیکه برای ایندکس کردن صفحه مورد نظر تلاش کرده است، با دستور noindex روبرو شده بنابراین، آن صفحه را ایندکس نکرده است. لازم به توجه است که اگر نمیخواهید این صفحه ایندکس شود که خب، کارتان را درست انجام دادهاید؛ در غیر این صورت باید دستور noindex را بردارید.
- Blocked by page removal tool: در حال حاضر دسترسی به این صفحه به دلیل درخواست حذف آدرس از سوی خودتان مسدود گردیده است. اگر مالکیت شما در سرچ کنسول تایید شده، می توانید از ابزار حذف URL استفاده کنید تا برای شما مشخص شود چه کسی درخواست حذف URL را ارسال کرده است. البته در نظر داشته باشید که عملکرد این ابزار، موقتی است؛ پس اگر میخواهید که این صفحه مسدود بماند، دسترسی به آن را به کاربران واردشده به سایت محدود کرده یا اینکه آن را حذف کنید؛ در غیر این صورت، احتمال دارد دوباره ایندکس شود.
- Blocked by robots.txt: اگر صفحهای در نتایج جستجو قرار داشته باشد، اما ناگهان به وسیله فایل robots.txt مسدود شود، معمولاً گوگل برای مدتی آن را در پایگاه اطلاعاتی خود نگه میدارد. دلیل این عمل این است که دسترسی به بسیاری از صفحات بهطور تصادفی مسدود میگردد لذا گوگل دستور noindex را بهعنوان بهترین نشانه از عدم تمایل مدیران سایت برای ایندکس شدن صفحات مختلف ترجیح میدهد. اگر این محدودیت دسترسی برای مدت زیادی ادامه یابد، صفحه از نتایج جستجو حذف میشود.
- Crawl anomaly: ایراد نامشخصی در هنگام بررسی این آدرس رخ داده است. این خطا میتواند در محدوده خطاهای 400 یا 500 باشد.این اتفاق زمانی به وقوع می پیوندد که مشکلی در خصوص fetch کردن لینک مورد نظر وجود داشته باشد. برای اطمینان از عدم وجود مشکل عمده در پایداری سایتتان با شرکت میزبان تماس حاصل کنید. ضمن اینکه تجربه نشان داده که آدرسهایی که در این بخش درج میشوند غالباً بخشی از یک زنجیره از تغییر مسیرهای متوالی یا صفحهای هستند که به صفحه دیگری که دچار خطای 404 شده تغییر مسیر میدهد؛ و یا اینکه صفحه هایی هستند که دیگر موجود نیستند و خطای 404 میدهند؛ پس وجود ایراد در تغییر مسیرها را بررسی کنید و مطمئن شوید که همه تغییر مسیرها تکمرحلهای باشند و صفحهای که آدرس شما به آن تغییر مسیر میدهد بهدرستی بارگذاری میگردد.
- Blocked due to unauthorized request: یکی از اشتباهات متداولی که منجر به این مشکل میشود آپدیت نکردن لینکها بعد از خروج سایت از مرحله بتا یا تست در یک زیردامنه دیگر (مثلاً beta.yoursite.com) است. این آدرسها را پیدا و اصلاح کنید. نسخه رایگان ابزار Screamingfrog SEO Spider میتواند در این مسیر برای شما کمکهای شایان توجهی داشته باشد.
- Crawled – currently not indexed: صفحه مورد نظر توسط گوگل بررسی و مرور شده، اما ایندکس نشده است. شاید این صفحه در آینده ایندکس شود و البته شاید هم نشود؛ اگر با چنین خطایی روبرو شدید، محتوای صفحه مورد نظر را بهدقت مورد مطالعه و بررسی قرار دهید، بهبود مؤلفههای محتوایی و فنی صفحه مورد نظر میتواند احتمال ایندکس شدن آن را در بررسی بعدی گوگل بیشتر کند.
- Discovered – currently not indexed: گوگل این صفحه را پیدا کرده، اما هنوز آن را بررسی نکرده است. اگر بخواهیم علت بروز این موضوع را شرح دهیم شاید بهتر باشد اینگونه بگوییم که اگرچه گوگل این آدرس را یافته است، اما احساس نمیکند که آنقدر اهمیت داشته باشد که برای بررسی آن وقت صرف کند. اگر میخواهید این صفحه در نتایج جستجو نمایش داده شود باید از سایتهایی بهغیر از سایت خودتان به آن لینک ایجاد کنید.
- Duplicate page without canonical tag: کپی یا کپیهایی از این صفحه وجود دارد که هیچکدام دارای تگ canonical نیستند. شما باید به طور دقیق مشخص و اعلام کنید که صفحه کانونیکال شما کدام یک بوده و آن را به گوگل نشان دهید.
- Alternate page with proper canonical tag: این صفحه، کپی صفحهای است که گوگل آن را بهعنوان canonical شناخته است و مرجع آن با استفاده از تگ مناسب مشخص شده است؛ پس کاری باقی نمانده که در اینجا انجام بدهید!
- Duplicate non-HTML page: برای شرح این موضوع باید گفت که گوگل یک فایل PDF در سایت شما یافته که حاوی همان اطلاعاتی است که در یکی از صفحات HTML سایت شما موجود است پس تصمیم گرفته که فقط نسخه HTML را ایندکس نماید. البته لازم به توضیح است که شما هم بعنوان وبمستر معمولا همین مطلب را میخواهید بنابراین اگر دنبال این نیستید که نسخه PDF ایندکس شود، انجام کار خاصی ضرورت ندارد.
- Google chose different canonical than user: این آدرس بهعنوان صفحه canonical تگ شده، اما از نظر گوگل یک آدرس دیگر میتواند canonical بهتری تلقی شود. بهترین کاری که قادرید انجام بدهید این است که از وجود تگهای canonical در تمام صفحات تکراری و همچنین صحت آنها و وجود لینک داخلی به صفحه canonical اطمینان حاصل کنید.
- Not found 404: خطاهای 404 که در این قسمت وجود دارند زمانی رخ میدهند که گوگل سعی میکند تا لینک موجود به صفحهای که وجود ندارد را مورد بررسی قرار دهد. بسیاری از خطاهای 404 به این دلیل ایجاد میشوند که پس از تغییر لینکهای سایت، تغییر مسیرهای مناسب از نسخه قدیمی به آدرس جدید انجام نشده است.
- Page removed because of legal complaint: اگر چنین خطایی را دیدید بلافاصله هر محتوایی که ناقض قانون کپیرایت است را حذف کرده و مطمئن شوید که سایت شما هک نشده باشد؛ زیرا که برخی از هکرها محتوای غیرقانونی در سایتهای هک شده قرار میدهند.
- Page with redirect: منظور از این پیغام این است که URL ریدایرکت شده و به همین دلیل به لیست ایندکس گوگل اضافه نشده است. بنابراین همه لینکهای قدیمی را آپدیت کنید تا موتورهای جستجو برای پیدا کردن محتوای شما مجبور نشوند که وارد مسیر سختی شوند.
- Queued for crawling: این صفحه در صف انتظار جهت بررسی و ثبت قرار دارد؛ برای بررسی آخرین وضعیت آن چند روز دیگر مجدد برگردید.
- Submitted URL dropped: شما درخواست ایندکس شدن این صفحه را داشته اید، اما بنا به دلایل نامشخصی از ایندکس شدن آن صرف نظر گردیده است. این مورد تقریبا مبهم است و اشکال اساسی زیاد گویا نیست. بنابراین نمیتوان با اطمینان اعلام کرد که انجام چه اقداماتی مناسبتر و لازمتر است. در اینجا بهترین حدسی که به ذهن میرسد شاید این است که گوگل به سراغ محتوای شما آمده، مدتی هم آن را بررسی کرده اما به این نتیجه رسیده که نباید آن را در پایگاه اطلاعاتی خود ثبت کند. پس با مشاهده این اشکال صفحه مورد نظر و کیفیت آن را بررسی نمایید.
- Submitted URL not selected as canonical: گوگل بر اساس خواسته شما آدرسی را بررسی کرده، اما خودتان به گوگل اعلام کرده اید که یک نسخه دیگر از آن صفحه باید مورد توجه قرار گیرد و ایندکس شود. برای جلوگیری از پیش آمدن چنین مشکلاتی نسخهای که میخواهید ایندکس شود را انتخاب کنید، آن را بهعنوان canonical نشانهگذاری کرده و در هر جایی که لازم میبینید به آن مجموعه آدرسهای مشابه لینک دهید، برای صفحه مزبور اولویت در نظر بگیرید.