canonical先がnoindex・404・リダイレクトなら、まず正規URLを200に戻す
Search Consoleでcanonicalや重複URLを調べる時は、対象URLだけでなく「canonicalで指定した先」も確認します。
正規URLとして指定した先がnoindex、404、5xx、または別URLへリダイレクトしていると、Googleに渡したいシグナルが弱くなります。先に、正規URLを200で開けるインデックス可能なページへそろえましょう。
先に結論
- 対象URLのcanonical先を確認する
- canonical先URLもURL検査する
- canonical先が200で表示できるか見る
- canonical先にnoindexやX-Robots-Tagがないか確認する
- canonical先が別URLへリダイレクトするなら、最終URLへ指定をそろえる
- サイトマップと内部リンクも最終的に出したいURLへそろえる
- 修正後に対象URLとcanonical先の両方をライブURLテストする
canonical先で起きやすいミス
canonicalは「このURLを代表にしたい」というシグナルです。その代表URL自体が検索に出せない状態だと、Googleは別のURLを選んだり、重複URLの扱いが安定しなかったりします。
| canonical先の状態 | 起きること | 直し方 |
|---|---|---|
| noindex | 正規URLを検索結果に出せない | 出したいページならnoindexを外す |
| 404または410 | 代表ページが存在しない扱いになる | 公開中の200ページへcanonicalを変える |
| 5xx | Googlebotが正規URLを取得できない | PHPエラー、サーバー設定、負荷を直す |
| 別URLへリダイレクト | canonicalと最終URLが遠回りになる | リダイレクト後の最終URLをcanonicalにする |
| robots.txtでブロック | Googleが正規URLを確認しにくい | 検索に出したいURLはクロール可能にする |
| ログイン必須や403 | Googlebotがページを読めない | 公開ページとしてアクセスできる状態にする |
対象URLとcanonical先は別々に検査する
Search ConsoleのURL検査では、対象URLだけを見て終わらせないのが大事です。対象URLに表示されたユーザー指定canonical、またはGoogleが選択した正規URLをコピーし、そのURLも別に検査します。
- 対象URLをURL検査する
- ユーザー指定canonicalをメモする
- Googleが選択した正規URLをメモする
- メモしたcanonical先URLをURL検査する
- ライブURLテストで現在のHTTP状態とインデックス可否を見る
canonical先がnoindexの場合
検索結果に出したいURLをcanonical先にしているのに、そのページがnoindexなら矛盾しています。meta robots、Googlebot向けmeta、HTTPヘッダーのX-Robots-Tagを分けて確認します。
- ページソースに
<meta name="robots" content="noindex">がない <meta name="googlebot" content="noindex">がない- HTTPヘッダーに
X-Robots-Tag: noindexがない - 共通headやテンプレートにnoindexを入れていない
- サイトマップへnoindexページを入れていない
noindexの場所を切り分けたい場合は、noindexタグによって除外されましたの確認順も合わせて確認します。
canonical先が404や5xxの場合
canonical先が404なら、存在しないページを代表に指定している状態です。記事URLを変更したあと、古いURLをcanonicalに残したままにしている時によく起きます。
| 状態 | 見る場所 | 対応 |
|---|---|---|
| canonical先が404 | ファイル配置、URL、サイトマップ | 公開中の正規URLへcanonicalを変える |
| canonical先が410 | 削除方針、代替ページ | 削除済みURLを代表にしない |
| canonical先が500 | PHPエラー、サーバーログ | まず200で表示できるように直す |
| canonical先が一時的に落ちている | ライブURLテスト、サーバー状態 | 復旧後に再検査する |
canonical先がリダイレクトする場合
canonical先がさらに別URLへリダイレクトする場合は、最終到達URLを確認します。Googleに伝えたいURLが最終URLなら、canonical、サイトマップ、内部リンクをそのURLへそろえます。
迷いやすい例
- AのcanonicalがBを指している
- Bを開くとCへ301リダイレクトする
- サイトマップにはAが入っている
- 内部リンクはAとBとCが混在している
この場合、検索結果に出したいURLをCにするなら、canonical、サイトマップ、内部リンクをCへ寄せます。
AIに渡す調査メモ
canonical先の問題は、対象URLとcanonical先URLと最終URLを分けて渡すと判断しやすくなります。
Search Consoleのcanonical先を確認しています。
対象URL:
検索結果に出したいURL:
対象URLのユーザー指定canonical:
対象URLでGoogleが選択した正規URL:
canonical先URL:
canonical先のHTTP状態:
canonical先のmeta robots:
canonical先のX-Robots-Tag:
canonical先のrobots.txt状態:
canonical先を開いた時の最終URL:
サイトマップに入っているURL:
内部リンクが向いているURL:
直前に変更したこと:
確認してほしいこと:
1. canonical先が検索に出せる状態か
2. noindex、404、5xx、リダイレクトのどれが問題か
3. canonical、サイトマップ、内部リンクをどのURLへそろえるべきか
4. Search Consoleで次に確認する項目