Copicode 日本語トップ

canonical先がnoindex・404・リダイレクトなら、まず正規URLを200に戻す

Search Consoleでcanonicalや重複URLを調べる時は、対象URLだけでなく「canonicalで指定した先」も確認します。

正規URLとして指定した先がnoindex、404、5xx、または別URLへリダイレクトしていると、Googleに渡したいシグナルが弱くなります。先に、正規URLを200で開けるインデックス可能なページへそろえましょう。

先に結論

  1. 対象URLのcanonical先を確認する
  2. canonical先URLもURL検査する
  3. canonical先が200で表示できるか見る
  4. canonical先にnoindexやX-Robots-Tagがないか確認する
  5. canonical先が別URLへリダイレクトするなら、最終URLへ指定をそろえる
  6. サイトマップと内部リンクも最終的に出したいURLへそろえる
  7. 修正後に対象URLとcanonical先の両方をライブURLテストする

canonical先で起きやすいミス

canonicalは「このURLを代表にしたい」というシグナルです。その代表URL自体が検索に出せない状態だと、Googleは別のURLを選んだり、重複URLの扱いが安定しなかったりします。

canonical先の状態起きること直し方
noindex正規URLを検索結果に出せない出したいページならnoindexを外す
404または410代表ページが存在しない扱いになる公開中の200ページへcanonicalを変える
5xxGooglebotが正規URLを取得できないPHPエラー、サーバー設定、負荷を直す
別URLへリダイレクトcanonicalと最終URLが遠回りになるリダイレクト後の最終URLをcanonicalにする
robots.txtでブロックGoogleが正規URLを確認しにくい検索に出したいURLはクロール可能にする
ログイン必須や403Googlebotがページを読めない公開ページとしてアクセスできる状態にする

対象URLとcanonical先は別々に検査する

Search ConsoleのURL検査では、対象URLだけを見て終わらせないのが大事です。対象URLに表示されたユーザー指定canonical、またはGoogleが選択した正規URLをコピーし、そのURLも別に検査します。

  1. 対象URLをURL検査する
  2. ユーザー指定canonicalをメモする
  3. Googleが選択した正規URLをメモする
  4. メモしたcanonical先URLをURL検査する
  5. ライブURLテストで現在のHTTP状態とインデックス可否を見る

canonical先がnoindexの場合

検索結果に出したいURLをcanonical先にしているのに、そのページがnoindexなら矛盾しています。meta robots、Googlebot向けmeta、HTTPヘッダーのX-Robots-Tagを分けて確認します。

noindexの場所を切り分けたい場合は、noindexタグによって除外されましたの確認順も合わせて確認します。

canonical先が404や5xxの場合

canonical先が404なら、存在しないページを代表に指定している状態です。記事URLを変更したあと、古いURLをcanonicalに残したままにしている時によく起きます。

状態見る場所対応
canonical先が404ファイル配置、URL、サイトマップ公開中の正規URLへcanonicalを変える
canonical先が410削除方針、代替ページ削除済みURLを代表にしない
canonical先が500PHPエラー、サーバーログまず200で表示できるように直す
canonical先が一時的に落ちているライブURLテスト、サーバー状態復旧後に再検査する

canonical先がリダイレクトする場合

canonical先がさらに別URLへリダイレクトする場合は、最終到達URLを確認します。Googleに伝えたいURLが最終URLなら、canonical、サイトマップ、内部リンクをそのURLへそろえます。

迷いやすい例

  • AのcanonicalがBを指している
  • Bを開くとCへ301リダイレクトする
  • サイトマップにはAが入っている
  • 内部リンクはAとBとCが混在している

この場合、検索結果に出したいURLをCにするなら、canonical、サイトマップ、内部リンクをCへ寄せます。

AIに渡す調査メモ

canonical先の問題は、対象URLとcanonical先URLと最終URLを分けて渡すと判断しやすくなります。

Search Consoleのcanonical先を確認しています。

対象URL:
検索結果に出したいURL:

対象URLのユーザー指定canonical:
対象URLでGoogleが選択した正規URL:

canonical先URL:
canonical先のHTTP状態:
canonical先のmeta robots:
canonical先のX-Robots-Tag:
canonical先のrobots.txt状態:

canonical先を開いた時の最終URL:
サイトマップに入っているURL:
内部リンクが向いているURL:

直前に変更したこと:

確認してほしいこと:
1. canonical先が検索に出せる状態か
2. noindex、404、5xx、リダイレクトのどれが問題か
3. canonical、サイトマップ、内部リンクをどのURLへそろえるべきか
4. Search Consoleで次に確認する項目

公式情報で確認する