Copicode 日本語トップ

Search Consoleの「クロール異常」「取得失敗」は、原因を決めつけずに分ける

Search Consoleで「クロール異常」「ページの取得に失敗」「テストできませんでした」のような表示が出た時は、原因がまだ1つに絞れていない状態として扱います。

いきなり記事本文やタイトルを直すのではなく、Googlebotが今そのURLへ接続できるか、DNSやSSLで止まっていないか、サーバーが遅すぎないか、認証やWAFで拒否していないかを順番に見ます。

先に結論

  1. 対象URLとSearch Consoleの表示文言、最終クロール日をメモする
  2. ブラウザで対象URLが200表示できるか確認する
  3. URL検査のライブテストで現在も失敗するか見る
  4. DNS、SSL、サーバー応答時間、WAF、アクセス制限を順番に切り分ける
  5. HTTPステータスが分かるなら、404、401/403、5xx、リダイレクトへ分類する
  6. 現在は成功するなら、過去の一時的な失敗か最終クロール日を確認する
  7. 修正後に公開URLをテストし、必要ならインデックス登録をリクエストする

まず「今も失敗しているか」を分ける

Search Consoleの通常表示は、Googleが最後に見た時点の情報です。修正済みでも、レポートには前回の失敗が残っていることがあります。

状態判断次にすること
ライブURLテストも失敗する現在もGooglebotが取得できない可能性が高いDNS、SSL、サーバー、WAF、認証を確認する
ライブURLテストは成功する一時的な失敗、または修正済みの可能性最終クロール日を見て、必要なら再リクエストする
ブラウザでも開けないユーザーにも影響している公開サイトの復旧を先に行う
自分のブラウザだけ見えるGooglebotだけ拒否、または環境差の可能性WAF、IP制限、Basic認証、User-Agent制限を見る

原因候補を広く見る

取得失敗は、最初から「5xx」や「404」と出るとは限りません。次の候補を順番に潰します。

原因候補よくある状態進む記事
DNSの問題ドメインが一時的に引けない、設定直後で不安定ドメイン設定、DNS反映、独自ドメイン設定を確認する
SSLの問題証明書エラー、http/httpsの混在、リダイレクトの不整合httpsからhttpへ戻る時
タイムアウトページ生成が遅く、Googlebotの取得が途中で止まる重いPHP、DB、外部API、画像処理を確認する
一時的なサーバー混雑短時間だけ取得失敗し、今は正常に表示される5xxの確認順
認証・アクセス制限ログイン必須、Basic認証、IP制限、WAFで拒否401/403の確認順
robots.txtクロールを止めていて取得の確認が進みにくいrobots.txtブロックの確認順
リダイレクトの失敗ループ、長すぎるチェーン、空の転送先リダイレクトエラーの確認順

HTTPステータスが分かったら分類する

ライブテストやブラウザ確認、サーバーログでHTTPステータスが分かれば、専用記事へ切り分けます。

見えた状態意味次に読む記事
200で表示できる現在は取得できる。過去の失敗か表示内容の問題を確認URL検査項目
404URLが存在しない見つかりませんでした(404)
401/403認証やアクセス制限で入れない401/403でブロック
500/502/503/504サーバー側で取得失敗しているサーバーエラー(5xx)
301/302が続くリダイレクト途中で止まっている可能性リダイレクトエラー
200だが本文が空に近い取得はできてもページとして弱い可能性ソフト404

自作PHPサイトで特に見る場所

ロリポップや自作PHPサイトでは、取得失敗が「一部ページだけ」「特定時間だけ」「Googlebotだけ」で起きることがあります。

AIに渡す調査メモ

取得失敗は原因候補が広いので、URL、時間、ライブテスト結果、ブラウザ表示、HTTPステータス、直前の変更をまとめると切り分けやすくなります。

Search Consoleでクロール異常・ページ取得失敗・テストできませんでした系の表示が出ています。

対象URL:
Search Consoleの表示:
最終クロール日:
ライブURLテスト:

ブラウザで開いた結果:
200 / 301 / 401 / 403 / 404 / 500 / タイムアウト / 未確認

発生範囲:
1ページだけ / 複数ページ / サイト全体 / 不明

直前に変更したこと:
DNS:
SSL:
robots.txt:
noindex:
Basic認証・ログイン必須:
WAF・IP制限:
.htaccess:
PHPエラーログ:

現在もGooglebotが取得できない状態か、過去の一時的な失敗かを切り分けてください。

公式情報で確認する