検索結果やインデックスからページを削除する方法について解説します。
検索結果やインデックスから削除する方法
一言で「ページをGoogleから削除する」といっても主に2つの概念があります。
- Googleの検索結果に表示されないようにする(インデックスされていることもある)
- Googleのインデックスから削除する
通常Googleの検索結果に表示させたくない場合、noindexを設定したり、ページを削除すれば自動的にGoogleのインデックスからコンテンツを削除してくれるため、特別な対応は必要ありません。
ただしGoogleが検索結果に表示されないようにするには再クロールの必要があり、ページにnoindexを設定したりページを削除しても再クロールされないと検索結果には残り続けます。
再クロールに時間がかかりすぎていつまでも検索結果からコンテンツが消えない場合に「古いコンテンツの削除ツール」「削除ツール」「sitemap.xmlへ削除対象ページを一時的に記載する」のいずれかを行うと削除を早めることができます。
補足:robots.txtについて
robots.txtでGoogleのクロールを弾いてインデックスを防ぐ方法もありますが、設定しても検索結果にページが表示される場合があります。
またnoindexを設定したページに向けてrobots.txtで制御をすると再クロールができないようになるため、検索結果に残り続けるケースもあることに注意が必要です。
Google Search Consoleの権限 | 削除されるまでの期間 | 削除対象 | |
---|---|---|---|
古いコンテンツの削除ツール | 不要 | 約1日 | Googleの検索結果 |
削除ツール | 必要 | 約1日 | Googleの検索結果 |
sitemap.xmlへ削除対象URLを一時的に記載 | 権限があれば「新しいサイトマップの追加」を利用可能。なければrobots.txtへsitemap.xmlを記載することで代用可能 | URLがクロールされ、Googleが404やnoindexを認識したタイミング | Googleのインデックス |
古いコンテンツの削除ツール
古いコンテンツの削除ツールの特長は、Google Search Consoleへ登録されていないサイトでも削除申請が可能という点です。
例えば、無料ブログやSNSなど、Google Search Consoleへ登録することができないサイトなどで利用できます。
ページが削除されており404または410を返している、またはnoindexタグが設置されているページを削除申請することが可能です。
(ソフト404では削除申請できません)
削除申請が承認されるまで約1日ほどかかり、承認されればGoogleの検索結果からページが削除されます。
ページがGoogleのインデックスから削除されるためには、Googleがページをクロールして削除処理するまで待つ必要があります。
また承認後に申請をキャンセルすることも可能です。
その際にGoogleがURLをクロールしてしてインデックス削除処理していない場合、削除申請前のコンテンツが再度検索結果に表示されます。
削除ツール
削除ツールは、Google Search Consoleへ登録しているサイトに対して削除リクエストが可能です。
404やnoindexタグに関わらず、どのステータスのURLでも削除リクエストでき、ページだけでなくディレクトリ単位(後述)で削除申請ができる点が特長です。
削除リクエスト後、約1日ほどで検索結果からコンテンツを削除することができます。
古いコンテンツの削除ツールと同様、インデックスからもページが削除されるためにはGoogleの再クロールが必要です。
また削除リクエストのキャンセルも可能で、削除リクエスト承認中にGooglebotがページを再クロールしていない場合には、削除リクエスト前のコンテンツが再度検索結果に表示されます。
削除ツールはindex対象のページでも検索結果から削除することができるツールなので、間違ったURLを削除リクエストしないように細心の注意を払って使用しましょう。
ディレクトリ単位の削除申請の方法
Search Console「削除」>「新しいリクエスト」で下記2箇所を調整することでディレクトリ単位の削除が可能です。
例えばURLをhttps://example.com/aaa/と入力して「このプレフィックスで始まる URL をすべて削除」とするとhttps://example.com/aaa/以下のURLがすべて削除されます。
sitemap.xmlへ削除URLを一時的に記載
ページが削除されていて404または410を返している、またはnoindexタグが設置されたページのURLをsitemap.xmlへ一時的に追加することにより、Googleのクロールを促進し、検索結果とインデックスからページを削除することが可能です。
ただしインデックスから削除されたあともsitemap.xmlへ削除対象ページを記載したままだと、Googleのクロールへ悪影響がでる場合があります。
インデックスから削除されたあとは速やかに削除対象ページをsitemap.xmlから撤去しましょう。
削除URLの一覧が掲載されたsitemap.xmlと通常のsitemap.xmlは分けた方が管理しやすいです。
ケーススタディ
・クロールが遅いケース
Googleが重要ではないと判断しているページは、sitemap.xmlへ記載してもなかなかクロールされずに、Googleの検索結果とインデックスからページ削除されないことがあります。
もしすぐに検索結果から削除させたい場合には、先に古いコンテンツの削除ツール、または削除ツールを使い検索結果からページを削除し、その後、sitemap.xml によるGoogleのクロール促進によるインデックス削除を待つ方法を取ると良いでしょう。
・ステータスコード・noindexによる処理の違い
404、410、noindexの処理の違いは以下の通りです。
- 404ページ:今まで問題なく表示されていたページが404を返した場合、インデックスからすぐにページが削除されない場合があります。これはGoogleが誤って404を返していると一時的に判断し、複数回そのページをクロールして404を何度も認識してから削除することがあるためです。
- 410・noindex:Googleが1回クロールしただけでそのページの削除やnoindexを認識できるため、404のときよりも早めにGoogleからページが削除される可能性があります。
このため、404よりも410やnoindexの方が早くページが削除される可能性があります。
・canonicalタグを使いURLを正規化している場合
canonicalタグを使いURLを正規化している場合、canonicalタグを記載している重複URLも削除、またはnoindexにする必要があります。もし、正規URLのみnoinexを記載している場合、重複URLが正規URLとしてGoogleに認識され、Googleの検索結果に表示されつづける可能性があります。
Google Search Consoleでページの削除を確認する方法
Google Search Console「カバレッジ」でページの削除状態を知ることが可能です。
「カバレッジ」>「見つかりませんでした(404)」「noindex タグによって除外されました」
クリックすると詳細なURLが一覧で表示されます。
一覧に削除対象ページが記載されていればGoogleからページが削除されていることが確認できます。(上限1,000URL)
※410の場合も「見つかりませんでした(404)」に記載されます。
※処理がされるまでの間は、一時的に「クロール済み – インデックス未登録」に分類されることもあります。
上記はあくまでページを削除したりnoindexした時の確認方法です。
ページは削除していない(またはnoindexしていない)が削除ツールを使って検索結果に表示されないようにするという状態の場合は対象外のため注意が必要です。