
URL正規化とは
Webサイト上の複数のURLに同一のコンテンツが生成されるケースがあります。
URLの正規化とは、このようなコンテンツのうち、正規(オリジナル)のURLをただ1つだけ指定することを言います。
正規化ができていないままですと、複数のURLにまたがる同一のコンテンツは重複コンテンツとみなされ、SEOの評価にも悪影響を与えてしまう可能性があります。
URL正規化が必要なケース例
どのように重複コンテンツが発生しURL正規化が必要になるのかをまとめてみました。
www.のありなし両方でアクセスできるURLがある
ドメインにwwwをつけてもつけなくてもアクセスできてしまうのは重複コンテンツの代表的なものです。
http://www.example.com
http://example.com
ドメインの「www.」のありなしはSEO上の優劣はありませんので、どちらのURLに正規化するかは好みで選択してもよいかと思います。
index.htmlのありなし両方でアクセスできるURLがある
index.htmlに限らず、index.phpやindex.cgiなどのファイル名を指定しない場合はディレクトリトップを表示させているような場合に起きる重複です。
http://www.example.com
http://www.example.com/index.html
こちらもドメインの「www.」のありなしとほとんど同じで、どちらに正規化しても問題はありません。
URLの文字列がどう見られるかで判断すれば良いでしょう。
特別な理由が無ければ、ファイルの拡張子を変更にしてもURLを変えなくて済むように「なし」のほうに正規化しておくがベターです。
httpとhttpsの両方でアクセスできるページがある
http://www.example.com
https://www.example.com
Googleはセキュリティの観点から「https」を推奨していますので、httpsでのページ表示に問題ないようでしたらhttpsページに正規化を行います。
URLパラメータを使用している
例えば広告の効果測定のために、同じ内容のランディングページに異なるパラメータを付与してアクセスを解析するケースがあります。
異なるURLパラメータが付与すると異なるURLとみなされますので、やはり重複となってしまいます。
ただし、URLパラメータは全て正規化すればよいわけではありません。
たとえばURLパラメータに応じて異なるコンテンツを見せている場合もあります。
このような場合は正規化を行ってはいけません。
コンテンツが多少異なる場合でも、正規化を行ったほうがよい場合もあります。
例えば一覧ページなどで、項目の表示順番を入れ替えただけのページが挙げられます。
Webサイトで使用されているURLパラメータを正規化するかどうかについては、SEOに詳しい人に判断してもらうことをおすすめします。
URLパラメータを用いる際のSEO上の注意点については下記にて解説しています。
https://www.sakurasaku-labo.jp/blogs/url-parameters
正規化を行わない場合のデメリット
URL正規化を行わない場合、複数の重複したページをGoogleがインデックスしてしまう可能性があり、それらのページの間で評価が割れてしまい、適切な順位がつかない可能性があります。
また、このような同じコンテンツばかりを公開している領域では、Googleが領域全体の評価を下げる傾向があります。
つまり正規化されている場合に比べて、正規化されていない場合では検索順位に悪影響を与える可能性があります。
URL正規化の方法
URL正規化の方法は複数ありますが、一般的に良く利用されている方法としては、【canonical】を設定して、オリジナルのページということを宣言するものです。
例えば、下記のように同じコンテンツのページが2つあったとします。
・http://example.com/one.html
・http://example.com/two.html
one.htmlをオリジナルに指定したい場合は、コピーページであるtwo.htmlのheadタグ内に、以下のように記述します。
<link rel="canonical" href="http://example.com/one.html">
この設定によってone.htmlがオリジナルであると検索エンジンに伝えることができます。
他にもリダイレクトによって正規化する方法があります。
ユーザーにtwo.htmlを表示させる必要がないのであれば、正規化先のURL(one.html)へ301リダイレクトを行い、オリジナルページに誘導することで、分散した評価を統合することができます。
また、そもそも同じコンテンツのページは生成しないのが理想ですので、可能な限りこのようなページを作らないのがベストです。
生成してしまったページにはリンクせず、隔離しておくのも(完全ではないですが)有効な手段です。
URLパラメータによる重複の場合、対処が複雑になる場合、Search Consoleから設定することも可能ですが、重要なコンテンツを検索結果から消してしまうリスクもあり、SEOに詳しい方に見てもらうことをおすすめします。
まとめ
対応方法にお悩みの場合は、まずは無料相談会で弊社のコンサルタントまでご相談を!
貴社サイトの状況をお伺いし最適な方針をご提案いたします。
LEAVE A REPLY