ブログ

クローラーとは?SEO対策を行う上で押さえておくべきポイント

クローラーとは、Googleの検索エンジンをはじめとするロボットがいろいろなサイトの情報を集めるために使用しているもののことです。

別名、Googlebotとも呼ばれ、ページを読み込み(クロールする)、サイト情報を収集格納(インデックス)することで、そのページを検索結果に表示するために必須の役割を担っています。

SEOにおいて、検索結果に対策中のページが現れないことは致命的なので、クローラーが担う役割は覚えておいた方が良いと言えるでしょう。

クローリング状況の確認はSearch Consoleで行う

クローラーはページをインデックスすることで、検索結果にページを表示させるという役割があります。
なので、クローラーがサイト内のどのページを読み込んでいるかについては、SEO対策において改善策を練るための指針の1つになります。

なお、クローラーがサイトに対してどういう動きをしているのかは、Search Consoleの項目で確認が可能です。
例えば、クロールエラーという項目では、クローラーがページをクロールした際のエラーの発生有無を確認することができる等です。

また、クロールの統計情報という項目では、一日に何回クローラーがページをクロールしたかを確認することができます。
このように、Search Consoleを用いることで、クローラーの行動に関して詳細な情報を入手することが可能です。

クローラー最適化を行う目的・必要性とクロールバジェット

Googleからすれば、クロールを行うにもリソースを消費するため、クローリングはGoogleにとってコストと言えます。
Googleにはクロールバジェット(クロール上限値)というものが存在します。

クロールバジェットとは、Googleが行うクローリングの上限値のようなものです。
つまり、クロールバジェットを超える量の情報が存在する場合、クロールされないページが発生します。

その場合、検索者に届けたい重要なページがクロールされなかったり、優先順位が低いページがクロールされた結果、サイト内に優れたコンテンツが少ないと判断され、評価が落ちてしまう可能性があります。
このような場合は、クロールの最適化が必要といえるでしょう。

ただし、クロールバジェットを超える量のページ数があるケースとは、データベースサイトやECサイト等、規格外の規模を持つ例外的なサイトのみと考えられています。
従って、一般的な規模のコーポレートサイト等は、クロールバジェットを気にする必要は無いと言えます。

クローラー最適化の方向性

一部の例外的な規模を持つサイトにおいては、優先順位をつけるために、クローラーの最適化が必要になります。
最適化の方法とは、重要なページは確実にクロールさせる一方、検索者にとって重要ではないページをクロールさせないことです。
これは、検索者にとって重要なページがクロールされなくなることを防ぐため、優先順位の低いページを後回しにするという意図に基づきます。

Googlebotにはユーザーと同じコンテンツを見せる

ユーザーとGooglebotに異なるコンテンツを見せることは、Googleのガイドラインに違反します。(悪質なものはペナルティを課されることがあります)
ユーザーが見えているコンテンツと同じものがGooglebotにも見えているかどうかを確認しましょう。
確認方法としては以下のものがあります。
・Search ConsoleのFetch as Googleにてレンダリングを行う
Pagespeed insightsによるレンダリングプレビューを見る
https://developers.google.com/speed/pagespeed/insights/?hl=ja
・Chrome Developer toolなどから、ユーザーエージェントをGooglebotに変更して確認する
(Chromeであれば、Network Condition内のUser agentをGooglebotに変更可能)

なお、GoogleはGooglebotのユーザーエージェントは公開していますが、IPは公開していません。
Googlebot一覧
https://support.google.com/webmasters/answer/1061943?hl=ja

どうしてもアクセス制限を行いたい場合はユーザーエージェントによる制限を行い、IPによる調整は極力避けることをおすすめします。
繰り返しになりますが、ユーザーとGooglebotに同じコンテンツを見せるのが基本です。

もしユーザーには見えているのにGooglebotには見えないページ(たとえば404ページが表示されたり、Googlebotだけリダイレクトされてしまうなど)があったとすれば、そのページは検索結果に表れることはありません。

不要なページにクローラーを辿らせない

不要なページにクローラーを辿らせない場合、リンクに rel= “nofollow” の設定が必要です。
rel= “nofollow“とは、検索エンジンに対して、指定したページを読み込ませないための設定のことです。

robots.txtで不要な領域全体へのクロールを禁止する

robots.txtとは、指定したページを検索エンジンに読み込ませないためのファイルのことです。
これは rel= “nofollow“と意味は同じですが、より範囲が広く、ファイル全体を読み込ませないようにすることができます。

不要なページはインデックスさせない

クローラーをブロックすることが難しい場合や適切でない場合は、noindexによってインデックスさせないよう指示したり、正規ページが別にある場合はcanonicalによる正規化を行うことができます。

参考
robot.txtとnoindex

まとめ

クロールバジェットは余程の規模のサイトや、パラメータを用いた複雑構造等でない限り、大きく意識する必要はないと言えます。
ただし、重要なページがクロール・インデックスされているかどうかは定期的なチェックをおすすめします。

◇この記事もおすすめ!
・SEO対策(検索エンジン最適化)とは?初心者にもわかりやすく解説します





■関連情報:サクラサクマーケティングのSEOコンサルティングサービス
中小・ベンチャー企業の売上をサポートするSEO対策低価格・高品質なSEOコンサルティング

無料メルマガのご登録(無料)

SEOの最新情報を無料でお届けします!





プライバシーポリシー

監修者:山口 真司

記事一覧

SEOシニアコンサルタント

学生時代、広告人材会社と起業家コンサルティング会社でインターンを経て2017卒としてサクラサクマーケティングの新卒1期生として入社。
SEOコンサルタントとしてインターン時代から案件を持ち、大手ポータルサイト等大型案件を中心に常時20サイト以上のクライアント様のWebマーケティング成功に注力。

サクラサク期待のエースとして、お客様のサポートだけでなく、社内業務効率化も取り組み日々奮闘中。



無料資料ダウンロード

サービス資料ダウンロード

用語集

ソースコード集

お役立ちリンク集

無料メルマガのご登録(無料)

SEOの最新情報を無料でお届けします!





プライバシーポリシー

お役立ちツール

カテゴリ一覧

タグクラウド

新着記事一覧

  1. インスタグラムの公式な投稿埋め込み方法がSEOに不向きな理由

    ブログやWebサイトだけでなく、インスタグラムやtwitterなどのSNSを運営していて、ブログ上でSNSの紹介や、逆にSNS上でブログの紹介をされる方も多いかと思います。 ブログ上でSNS投稿を紹介する場合、投稿埋め込 […]...

      1. サクラサクラボ9月のツイートまとめ

        当サイトのツイッターアカウント(@sakurasakulabo)のツイートから、9月のイベントを振り返ります。 ツイッターのフォローはこちらからお願いします。 Follow @sakurasakulabo 目次 9月の順 […]...

おすすめコンテンツ

  1. SEO対策(検索エンジン最適化)とは?初心者にもわかりやすく解説します

    SEO対策とは「検索エンジン最適化」のことで、数あるWeb集客手法の中でも、検索エンジンからの成果を最大化することです。基本的にはユーザーや検索エンジンからより評価されるように、WebサイトやWebページの変更・改修を続 […]...

    1. コンテンツマーケティングとは?特徴と事例、社内でできる方法を解説します

      ここ数年で急激にコンテンツマーケティングという言葉を聞くようになりました。しかし、「興味があるがまだ着手できていない」という人や、「そもそもどんなコンテンツを作ればいいのかわからない」、「社内で運用しているが成果がでない […]...

      1. SEOに強いコンテンツは回答性×網羅性×文字数×ユーザー体験

        目次 SEOに強いコンテンツとは回答性網羅性文字数ユーザー体験[回答性×網羅性×文字数×ユーザー体験]を考慮したSEOに強いコンテンツ制作お問い合わせフォーム SEOに強いコンテンツとは 検索エンジンで上位表示をさせるた […]...

最新情報を取得する

PAGE TOP