URLの正規化について解説します。
URLの正規化とは
URLの正規化とは同一内容のコンテンツの評価を一つのURLにまとめることを指します。
代表的なケースは次のようなものです。
- 同一内容が表示される複数のURLが存在するケース
- 意図しないパラメーターが付与されてパラメーターの有無で同一コンテンツを表示するケース
- テンプレートやデザインが異なるものの同一の複数コンテンツが存在するケース
- www有無、http・httpsがばらばらになっているケース
- 自社サイトのコンテンツを他サイトに転載(配信)するケース
正規化を実施することにより、複数の同一内容のページのインデックスや、ページ(コンテンツ)評価を一つにまとめることができます。
URLの正規化をユーザーが行う理由
URLの正規化を実施する理由は、意図しないURLの正規化が行われたり、同一コンテンツと複数のURLがバラバラに存在してしまうことがあるためです。
派生して内部リンク・外部リンクの評価が分散され、本来のコンテンツ評価をまっとうに獲得できない、クロールするURLが増えるためクローラビリティにも悪影響が出ることがあります。
(補足)
URLの正規化を行わなくともGoogle側で自動でURLを正規化してくれることもありますが、必ずしもサイトオーナー側の意図通りになるとは限らないため正規化を設定することを推奨します。
URLの正規化を行う方法
URLの正規化を行う方法を紹介します。
(1)301リダイレクト
意図しないURLが表示されてしまうケースなどでも使用しやすい、もっとも確実性の高い正規化の方法です。
ただし正規化対象以外のURLを大量に301リダイレクトした場合、Googlebotにソフト404扱いされるケースもあります。意味のないリダイレクトを闇雲に実施しないように注意しましょう。
また設定後はインデックス状況などSearch Consoleで定点観測することを推奨します。
(2)canonicalタグ
canonicalタグに正規化用のURLを記述することでGoogleに正規化を提案することができます。
あくまで「提案」のためGoogleがこの提案に従って処理してくれないことがあったり、canonicalの記述先のURLをGoogleが読み込んでコンテンツの同一性を判断する時間がかかることもあります。
(3)sitemap.xmlへ正規URLを記載
正規URLをのみをsitemap.xmlに記載することでGoogleに正規化を提案することができます。
こちらはcanonicalタグと併用して使用しましょう。
非正規URLはsitemap.xmlに記述をしないように注意が必要です。
URLの正規化を行える例
具体的にURLの正規化を行える代表的な例として以下のようなものがあります。
(1)正規URLに表示されているコンテンツの一部が、非正規URLに表示されているケース
注意点として、非正規URLに、正規URLのコンテンツの一部「以外」のコンテンツが表示されている場合、URLの正規化が行われない可能性が高まります。
(2)複数の分割ページから、1つのすべて表示されるページへ正規化するケース
またカテゴリーページなどのリストページでは、ページの更新頻度が多いとcanonicalを記載してもURLの正規化が行われるまでに多くの時間がかかることがあります。
(更新頻度が多い場合、ページ内容が更新され異なるページとして認識されることもあるため)
URLの正規化が行えない例
次に正規化が行えない代表的な例です。
(1)ページングの2ページ目以降から1ページ目の正規化
(2)複数の分割ページの2ページ目以降から1ページ目への正規化
上記はページごとの内容が異なるため原則的に正規化をすることができません。
提案とおりにURLの正規化が行われているか確認する方法
正規化の実施が適切に行われているかどうかはSearch Consoleで確認します。
301リダイレクトの場合
個別のURLで正規化を確認する場合にはリダイレクト前のURL検査で確認します。
- ページにリダイレクトがあります
- ユーザーが指定した正規 URL:リダイレクト先のURL
- Google が選択した正規 URL:ユーザーが指定した正規 URL と同じ
上記3点が確認できればリダイレクトによる正規化が適切に設定されています。
サイト全体の状態を確認する場合(http→httpsに統一した等)は「カバレッジ」>「除外」>「ページにリダイレクトがあります」項目で確認しましょう。リダイレクトの全体像が確認できます。
canonicalタグ・sitemap.xmlへ正規URLを記載した場合
301リダイレクトと同様、個別のURLであればURL検査、全体であればカバレッジで確認します。
非正規URLのURL検査を確認します。
- 代替ページ(適切な canonical タグあり)
- ユーザーが指定した正規 URL:正規化先のURL(canonical先)
- Google が選択した正規 URL:ユーザーが指定した正規 URL と同じ
上記3点を確認しましょう。
カバレッジは「カバレッジ」>「除外」>「代替ページ(適切な canonical タグあり)」項目で確認します。
もし下記のような表示がされている場合には正規化がうまく行っていない可能性もあります。ページを再度確認してみましょう。
・「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」
正規化設定されていてもコンテンツが同一として判断されていない可能性があるためページを改めて確認、またGooglebotがクロールしたコンテンツが同一かどうかなどを確認する。
・「重複しています。送信された URL が正規 URL として選択されていません」
sitemap.xmlに非正規のURLを送信している可能性があるためsitemap.xmlを改めて確認する。