sitemap.xmlについて解説します。
sitemap.xmlとは
sitemap.xmlとはサイトのURLをGoogleなどの検索エンジンに伝えるファイルのことです。
通常のウェブページのURL以外にも動画・画像のURL、代替言語ページURL、スマートフォンのアノテーションURLなどを伝えるのにも役立ち、正規化対象URLの参考としても使用されます。
一般的にXML形式で記述しますが、URLを羅列したTXT形式(sitemap.txt)でも読み込みが可能です。
sitemap.xmlの利用方法
sitemap.xmlは作成後、検索エンジンに存在を検知させる必要があります。
Google Search Consoleから送信する
もっとも一般的な方法はGoogle Search Consoleから送信する方法でSearch Consoleの
インデックス > サイトマップ
箇所から送信可能です。
(sitemap.xmlの送信が問題なく実施できている状態)
もしSearch Consoleから送信するのが難しい場合には下記のような方法を検討してみましょう。
pingツールを使用
https://www.google.com/ping?sitemap=サイトマップのURLを記載
上記、サイトマップのURLを記載を実施してブラウザのアドレスバーに入力し、完了です。
robots.txtにサイトマップURLを記述
robots.txtに「Sitemap:サイトマップのURL」を記述することによりクローラーに検出を促します。
例)
Sitemap: https://example.com/sitemap.xml
これらの方法は併用することも可能ですが、Search Consoleから送信しておくとサイトマップのエラー状況なども確認できるため、Search Console上の送信を優先して行うことをおすすめします。
Search Consoleに登録すれば他のものは実施しなくても問題ありません。
sitemap.xmlを利用時の注意点
sitemap.xmlを利用する際の注意点です。
Googleに使用されていない要素について
Googleは、<priority> と <changefreq> の値を無視しているので設定不要です。
正確に記述すべき要素
<lastmod>(最終更新日)は正確に記述しましょう。
記述が正確でなかった場合、Googleではこの値を利用しなくなります。
正確に記述できないようであれば敢えて記述しなくても問題ありません。
上限値に関する注意事項
一つのsitemap.xmlに記述できる上限値はURLが50,000、ファイルサイズが圧縮されていない状態で上限50MBです。
上限を超えるような場合には、サイトマップを分割して作成しましょう。
モバイル版とデスクトップ版でURLが異なる場合
モバイル版とデスクトップ版でURLが異なる場合はPC、またはモバイルのURLをのみをsitemap.xmlに記述しましょう。
URLが別の場合、サイト内のcanonicalやアノテーションが正確に実装されていることが前提となります。
ただし、サイト内のアノテーション実装が難しい場合、代わりにsitemap.xmlにモバイルのアノテーションを記述して対応することも可能です。
(サイト内のアノテーションを実装した上でsitemap.xmlを併用することも可能)
sitemap.xmlの必要性
sitemap.xmlはすべてのサイトに必要なものではありません。
sitemap.xmlが不要なケース
小規模サイト〜中規模サイトでサイト内ページに内部リンクが設定されている場合、GoogleはすべてのURLをクロールしようとするため設定しなくても問題ありません。
公式のヘルプでは500ページ未満の小規模サイトについては設定不要としています。
判断がつきにくいようであればSearch Console「カバレッジ」ですべてのURLが検出できているかどうかを目安の一つにすると良いでしょう。
sitemap.xml未設定の状態すべてのURLを検出できているということであれば追加設定は不要です。
sitemap.xmlが必要なケース
sitemap.xmlは大規模サイトをはじめ、複雑なサイトで必要になるケースが多いです。
- 規模が大きく場合によっては内部リンクが見つけにくいサイト
- 内部リンクがうまく設定できないサイト
- canonicalの挿入が難しいため正規URLを伝える方法がないサイト
自分のサイトでURLが伝えにくい(たどりにくい)構造になっている場合にはsitemap.xmlの導入を検討してみましょう。
Search Consoleでのsitemap.xmlを利用する際のコツ
Search Consoleでのsitemap.xmlを利用する際のコツを紹介します。
項目別にsitemap.xmlを登録してカバレッジ状況を確認する
Search Consoleからsitemap.xmlを送信すると、sitemap別のカバレッジを確認することができます。
例えば下記のように項目別のsitemap.xmlを作成することで、各項目のインデックス状況を把握できるのでおすすめです。
https://example.com/sitemap_article.xml(記事ページをまとめたsitemap)
https://example.com/sitemap_category.xml(カテゴリページをまとめたsitemap)
URL更新の多いサイトはRSSフィードの送信も活用
GoogleではRSS 2.0とAtom 1.0のフィードも使用できるため、更新などが多いサイトではこれらのフィードを送信することもおすすめします。
sitemap.xmlと同じく、Search Consoleから登録することが可能です。