SEO研究所サクラサクラボ

SEO・コンテンツマーケティングを成功に導くパートナー

インデックスカバレッジレポートの見方とエラーや除外への対処法

サーチコンソールを利用していると、Googleから「『インデックス カバレッジ』の問題が新たに検出されました」というメールが届いたことはありませんか。

これはGoogleが何らかの原因でサイト内のページをインデックスすることができなかったことを伝えるメッセージです。

この問題の解決に使用するカバレッジレポートは、エラー警告があった場合だけでなく、普段からインデックス状況を確認するために利用できる、非常に有用なレポートです。

この記事ではインデックスカバレッジレポートの見方と、エラーメッセージごとの対処法を解説します。

インデックスカバレッジレポートとは?

Googleはクローラーが発見したウェブページをクロール・インデックスし、検索結果に表示させています。ページの情報をGoogleのデータベースに格納することをインデックスと呼びますが、サイト内のどれだけのページがインデックスされたかを一覧できるのがインデックスカバレッジレポートです。

インデックスカバレッジレポートはサーチコンソール内の機能の1つで、ツール内左メニューの「カバレッジ」から確認できます。

インデックスカバレッジレポート

インデックスカバレッジのエラーは、Googleがそのページを正しくインデックスできていないことを意味しており、エラーを解消しない限り、当該ページはGoogleにインデックスされず、検索結果に表示されることもありません。SEO的には、インデックスされていないページは、ページ自体が存在していないのと同義ともいえるでしょう。

そのため、インデックスカバレッジのエラーには、早急な対策が推奨されます。エラーが検出されると、次の方法で通知されます。

  • Googleから「『インデックス カバレッジ』の問題が新たに検出されました」のメールが届く
  • サーチコンソール上のメッセージ一覧にエラーメッセージが表示される

サーチコンソールを見ていなかったとしても、メールさえ見逃さなければエラーメールに気づくはずです。
また、エラーメッセージがなくとも、カバレッジレポートは定期的にチェックしておきたいレポートの1つです。

以下、カバレッジレポートの確認方法を紹介します。

インデックスカバレッジステータスの意味と対処法

カバレッジレポート内に表示されるステータスは次の4種類です。

  • エラー
  • 有効
  • 有効(警告あり)
  • 除外

特に「エラー」と「除外」の件数に着目しましょう。「エラー」が1件以上ある場合、Webサイトに問題が発生している可能性があります。「除外」についても、意図せずページがインデックス対象外になっているケースや、膨大な除外ページ数がクローラーの回遊性を妨げているケースがあるので、注意が必要です。

エラー

当該ページ(URL)はインデックスに登録されていません。検出メッセージをクリックすると詳細画面が表示され、対象のURLを確認することができます。

具体的な検出メッセージと対処法を解説します。

送信された URL に noindex タグが追加されています

「送信されたURLにnoindexタグが追加されています」のカバレッジエラー

このエラーをはじめ、「送信されたURLが(に)……」の各エラーは、当該URLをGoogleにインデックスしてほしいURLとしてサイトマップ(sitemap.xml)にて送信しているにもかかわらず、何らかの理由でインデックスできなかったことを示しています。

元はといえばサイトマップが適切に作成されていないことが原因であることがほとんどですので、サイトマップを作成する場合には、インデックスさせたいURL(正規URL)のみを記載するようにしましょう。

このエラーでは、noindexタグ(インデックスされたくない旨の意思表示)を付けているURLが、XMLサイトマップ(sitemap.xml)に含まれている矛盾が原因です。

エラー項目をクリックすると具体的なURLリストが表示されますので、1つ1つ確認しましょう。

URL一覧

意図してnoindexタグを記述しているページの場合はサイトマップ(sitemap.xml)から当該URLを削除し、インデックスさせたいURLであればnoindexを削除します。

詳しくは以下の記事も参照ください。

「送信されたURLにnoindexタグが追加されています」のエラー原因と改善方法
https://www.sakurasaku-labo.jp/blogs/submitted-url-marked-noindex

送信された URL が robots.txt によってブロックされました

このエラーの場合は、URLがrobots.txtに含まれていることが原因です。

robots.txtとはクロールをブロックするページやディレクトリを指定するためのファイルです。

robots.txtの内容が意図したものになっているかどうかを確認し、サイトマップもしくはrobots.txtを修正して矛盾を解消しましょう。

送信された URL が見つかりませんでした(404)

当該URLは404エラー(404 not found)のページでした。
404であることが問題ないかを確認のうえ、問題なければ、サイトマップから当該URLを削除しましょう。

送信された URL はソフト 404 エラーのようです

サイトマップによって送信されたURLであるにもかかわらず、対象ページが404ページだと考えられる場合に表示されるエラーです。

ソフト404とは、ステータスコードが200を返している(正常)にもかかわらず、404エラーページのような見た目であるとGoogleから判断されたページのことです。コンテンツがないと判断されていますので、このようなページはインデックスされていません。

対応としては、コンテンツが存在しないのであればステータスコードを404に変更しましょう。一方、インデックスさせるつもりでページを作成したにもかかわらずこのエラーが出ている場合は、ページオリジナルの情報が足りていない可能性があります。「除外」の項目でも説明しますが、コンテンツの追加やオリジナリティを向上させることでインデックスさせる必要があります。

サーバーエラー(5xx)

サーバー側に問題があると考えられ、ページが閲覧できない状態になっている可能性があります。例えばエラーコードが「503(Service Unavailable)」の場合は、サーバーがサービス利用不可の状態であることを意味します。
ブラウザでアクセスするか、サーバーのログを確認してみましょう。Webサイトにアクセスが集中してサーバーがリクエストを処理しきれない、もしくはサーバーメンテナンス中であることが原因のケースが多いです。現在進行形で問題が継続している場合は5xxが出てしまう原因を取り除くようにしましょう。
心当たりがなく、ブラウザで開いても200(正常)である場合はひとまず様子を見てよいかと思います。

リダイレクトエラー

このエラーはリダイレクトの回数が多すぎることにより発生する可能性があります。Googleのクローラーは5回以上のリダイレクトの繰り返しを追わないと言われています。このような繰り返しはリダイレクトチェーンと呼ばれ、サイト運営上好ましいものではありません。また、より悪いケースでは、最終的な行き先が決まらずにループしてしまっているリダイレクトループも起こりえます。
SSL化(httpからhttpsへの変更)やサイト移転などに際して行ったリダイレクト設定が間違っていないかどうかを確認し、複数回のリダイレクトはできれば1回にまとめるようにしましょう。

参考:「リダイレクトが繰り返し行われました。」のエラーとは?リダイレクトループの原因と対処法
https://www.sakurasaku-labo.jp/blogs/redirect-loop

有効(警告あり)

インデックスカバレッジ - 警告あり

「有効(警告あり)」のページは、インデックスに登録された一方で、Webサイト運営者として注意すべき問題があることを示しています。

主なメッセージに「robots.txt によりブロックされましたが、インデックスに登録しました」があります。これは、当該URLはrobots.txtでインデックスをブロックしているものの、ほかのページAから当該URLリンクが貼られているためにインデックスされたことを示しています。おそらく、この場合のページAというのは外部のサイトですので、リンク設置または削除はコントロールできないケースも多いのではないでしょうか。

このようなページは検索結果では、以下の図のように「このページの情報はありません」とのスニペットとともに表示されます。
robots.txtでブロックされたページは、Googlebotがクロールできませんので、リンクのアンカーテキストなどの周辺情報からタイトル部分を生成して、ディスクリプションのないままインデックスが作成されるためです。

このページの情報はありません

対処法としては、以下のようなものが挙げられます。
・このままにしておく
・クロールさせても問題ないのであれば、robots.txtによるブロックを解消する
・インデックスさせたくない場合は、robots.txtによるブロックを解消し、noindexを挿入しておく
・予期せず閲覧されることを防ぎたい場合は、ベーシック認証やIPなどによりアクセス制限を行う

有効

インデックスカバレッジ - 有効

ページがインデックスに登録されていることを示しています。

送信して登録されました

サイトマップから送信してインデックスに登録されたURLです。
サイトマップに記載されたURLがすべてインデックスされているのが理想です。

サイトマップファイルに記載されたURLのインデックス状況については、左メニューの「サイトマップ」から該当のサイトマップファイルを選択し、「インデックスカバレッジを表示」から確認してみましょう。

サイトマップのインデックスステータス

インデックス登録されましたが、サイトマップに送信していません

サイトマップに記載されていないのにもかかわらずインデックスされたページです。該当するURLリストを確認してみましょう。
該当するページが重要なページである場合は、サイトマップに記載することをおすすめします。
一方で、インデックスしたくないページなのに意図せずインデックスされてしまうような場合もあります。このような場合は、canonicalやnoindexを見直す、robots.txtやnofollowなどのクロール制御を行う、そもそもページを生成しないよう調整する、といった施策が考えられます。

除外

「除外」のページは、前述のエラー以外の要因でインデックスに登録されていません。例えば、明示的にnoindexタグが付いているページや、すでにインデックス登録済みの正規ページと重複しているページなどです。

「有効」のページ数と比較して少なければ対処する必要性は低いでしょう。しかし、「除外」のページが膨大な場合は、クロールバジェットの枯渇によってクローラーの回遊性(クローラビリティ)に悪影響を及ぼす可能性があるため、あらかじめ対策を講じておくことをおすすめします。(クロールバジェットとは、クローラーが設けている1つのWebサイトで巡回できるページ数の上限値です。)

特に、サイトによって「検出 – インデックス未登録」や「クロール済み – インデックス未登録」は数が多くなりがちなので、チェックしておくことをおすすめします。

「除外」に関する具体的な検出メッセージには、次のものがあります。対処法とともに紹介します。

noindex タグによって除外されました

noindexタグを付けているページが該当します。意図してnoindexタグを付けているのであれば問題ありません。対処不要です。

robots.txt によりブロックされました

robots.txtに含まれているページが該当します。意図してブロックしているのであれば問題ありません。対処不要です。
しかし、前述のように、ブロックしていてもインデックスされることはありうると認識しておく必要があります。
インデックスさせたくないのであれば、noindex付与することを検討してみてください。

検出 – インデックス未登録

サイトマップ(sitemap.xml)や内部リンクによってクローラーはページを検出したものの、インデックスが未登録の状態であるページが該当します。

通常はURL検出後ほどなくインデックスに登録されますが、しばらく時間が経過してもステータスが変わらない場合は、コンテンツの品質に問題があるかもしれません。
念のため該当のURLをURL検査ツールでインデックスステータスを確認してみてください。
インデックスされているが、ラグのために未登録としてレポートされていることもあるためです。

参考:URL検査ツール(旧:Fetch as Google)とは?初心者でも分かる簡単な使い方
https://www.sakurasaku-labo.jp/blogs/url-inspection-tool

URL検査を行ってもインデックスされていない場合、特に該当数が多い場合は、クロールバジェットの枯渇が考えられます。後述「クロール済み – インデックス未登録」と同様に、コンテンツの品質を高めたり、クロールすべきページを減らすなどの対策を講じたほうがよいでしょう。

クロール済み – インデックス未登録

URLを発見後ページがクロールされたものの、インデックスされなかったページが該当します。「コンテンツが薄い」「重複ページである」「サイトマップ(sitemap.xml)で通知されているものの、サイト内のどこからもリンクされていない」といった理由により、Googleが「さほど重要なページでない」と判断したためと考えられます。

「クロール済み – インデックス未登録」は、ECサイトなどのデータベース型サイトで頻発する傾向があります。
重複ページが多いなどによりオリジナリティが低い割にサイト内にあまりにページが多い場合、クロールバジェットの枯渇を招く要因にもなりえます。

そのため、コンテンツの品質を高めてGoogleがよりクロール頻度を高めるべきサイトであると認識させる必要があります。

たとえば以下のような状況になっていないか確認してみましょう。

  • ページ内のオリジナルなメインコンテンツ部分が、ナビゲーションなどのサイト共通要素と比べて少なくなっていないか
  • 他サイトからのコンテンツを拝借するなど、サイト自体のオリジナリティが低くなっていないか
  • URLパラメータなどによって重複ページが発生していないか
  • 発生した重複ページはリダイレクトまたは最低でもcanonicalによって正規化されているか
  • 発生した重複ページが無秩序にクロールされないようにnofollowやrobots.txtによるブロックをしているか
  • そもそも重複ページや低品質なページを生成しないようにしているか

このようなコンテンツ要因やクロール要因によってインデックスされない場合の対応については以下の記事の該当項目も参照ください。

ページがインデックスされていない場合の対応
https://www.sakurasaku-labo.jp/blogs/indexing

なお、インデックス未登録の要因が次に該当する場合は、基本的に対処は不要です。

  • Feedページである
  • ページネーションされたページである
  • 誤検知、タイムラグ(メッセージに基づいてあらためてURL検査をするとインデックスされている場合はこちらに該当します)

代替ページ(適切な canonical タグあり)

「rel=”canonical”」タグで正規化済みのページが該当します。意図して正規化しているのであれば問題ありません。対処不要です。

ページにリダイレクトがあります

リダイレクト設定しているページが該当します。特段対処の必要はありませんが、リダイレクトチェーンが長い場合は、リダイレクトのステップの数だけクロール対象のURLが増えるため、クロールバジェットを浪費する要因となりえます。極力1ステップで目的のURLにリダイレクトするように設定することをおすすめします。

見つかりませんでした(404)

クロール時に404エラー(404 not found)が返ってきたページです。サイトマップ(sitemap.xml)に当該ページの記載はないものの、以前は200で存在していた場合や、別ページや外部サイトからのリンクが検出された場合に発生します。

意図して削除済みのページであれば特に対処不要ですが、ページが別URLに移動した場合にはリダイレクト設定をしましょう。

重複しています。ユーザーにより、正規ページとして選択されていません

「rel=”canonical”」タグが自身のページに向けて設定されておらず、Googleもインデックスする必要がないと判断したページです。
このページをインデックスさせたいのであればcanonical設定を確認してみましょう。

またサーチコンソールのURL検査ツールを使うと、Googleが正規として認識しているページを確認することができます。

参考:URL検査ツール(旧:Fetch as Google)とは?初心者でも分かる簡単な使い方
https://www.sakurasaku-labo.jp/blogs/url-inspection-tool

重複しています。送信された URL が正規 URL として選択されていません

(画面挿入)

サイトマップ(sitemap.xml)に含まれているものの、Googleが重複コンテンツと判断し、別URLを正規ページとしてインデックスしているページが該当します。このページの代わりに、Googleが正規ページとみなしているページがインデックスされています。

このページのcanonical設定が間違っていないか、もしくはサイトマップ(sitemap.xml)に記載しているURLが誤っていないか、確認しましょう。Googleがインデックスしている正規ページは、上記のとおりURL検査ツールで確認することができます。

重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました

このページに向けて別のページから「rel=”canonical”」タグで正規ページとして設定されているものの、Googleが別のページのほうが正規ページとして適切と判断したために、このページはインデックスされていません。

URL検査ツールでGoogleが正規ページとしてインデックスしているページを確認しましょう。そのページが正規ページとしてみなされることが問題なければ、「rel=”canonical”」タグの内容を修正します。

正規ページとしてほかのページをインデックスしてもらいたい場合は、「重要なページだ」と判断してもらえるように、コンテンツの質とオリジナル性を高める必要があります。
対処後、サーチコンソールのURL検査ツールで「インデックス登録をリクエスト」してみましょう。

エラーを解決したら「修正を検証」を行う

上記のステータスのうち、「エラー」と「有効(警告あり)」については修正を行うとサーチコンソール上からGoogleに検証依頼を出すことができます。
「有効」と「除外」については検証できませんので、施策効果があったかどうかの振り返りのためには除外のURL数などを記録しておくとよいでしょう。

「修正を検証」では明示的に「合格」または「不合格」と判定されますので、可能であればやっておきましょう。

ただし、同じエラーが出ている対象URL全て(上記のキャプチャでは6URL)を修正しないと、検証開始できない、もしくは開始できたとしても不合格となってしまうので注意が必要です。

カバレッジレポート内に「修正を検証」のボタンがあるので、ここから再クロールを依頼しましょう。

修正を検証

数日でメールやサーチコンソール上で結果がレポートされます。
検証結果は「合格」または「不合格」で判定されます。

不合格の場合は、該当項目すべてのURLについて確認を行ったか、もしくは別のエラーが出ていないか、などの観点からあらためてページを見直しましょう。

まとめ

Googleからインデックスカバレッジのエラー検出のメールを受け取ると、焦るかもしれません。メールにはエラー内容も記載されていますので、落ち着いて確認しましょう。

また、エラーが出ていなくても、インデックスはSEOの前提となる非常に重要なプロセスですので、自身のサイトがどれくらいインデックスされているかは定期的に確認しておくことをおすすめします。

執筆者 / 監修者

監修者:根岸 雅之
監修者:根岸 雅之
サクラサクマーケティング株式会社 取締役社長 COO

1980年生まれ 東京都稲城市出身、都立三鷹高等学校、専修大学文学人文科学を卒業後、2003年に学校関連の広告・出版を扱う株式会社JS コーポレーションに入社。
3年勤務した後に、学生時代より、ベンチャー企業への興味関心が高かったこと、より企業の課題解決に向き合っていきたいという想いから、WEB マーケティング業界へ転身。
2006年にSEM コンサルタントとして、インターネット総合代理店、株式会社オプトに入社。リスティング、ディスプレイ広告の運用から、SEOの施策提案など主にキーワードマーケティング領域に特化した業務に従事。

同年10月に、当時4名のベンチャー企業であった当社の役員と共鳴し、転職。入社後は、営業をはじめ、SEOコンサルティング、新規事業開発、自社マーケ、人事、財務と幅広い領域を経験し、営業部長、執行役員、取締役と経て、2015 年に社名変更とともに取締役社長に就任。

SEOコンサルタントとして大規模サイトから新規サイトまで、売上向上に繋がるコンサルティングを武器に200サイト以上の実績。9年連続でラスベガスで開催されるPUBCONに参加するなど海外の最新のSEO情報の収集にも尽力。
現在は、サクラサクラボの編集長、サクラサクラボチャンネルでの情報発信などの自社マーケティングを通じてBtoBマーケティングにも精通し、ここで培ったノウハウをもとにコンサルティングを展開。

3歳から現在に至るまで、サッカーを続けており、組織マネジメントにおいて、この経験値を大いに活用している。

その他のブログ記事

Return Top