SEOの話題の中でも常に関心の高い話題に、重複コンテンツの問題があります。
2011年(日本では翌年)にパンダアップデートがリリースされ、低品質なページは評価が下がり、検索順位が落ちていきました。
それ以降、コンテンツの品質を高めることがSEOで最も重要な課題となり、重複するコンテンツへの対策にも一層注目が集まるようになりました。
おそらく、重複コンテンツと無縁でいられるWebサイトはほとんどないでしょう。
それくらい、どんなサイトにも起こり得る「あるある」な問題です。
具体的にはSEOにどんな影響があるのか、そもそもどこからが重複コンテンツの扱いになるのか、重複コンテンツの定義について改めて正しく理解しておきましょう。
重複コンテンツとは
重複コンテンツとは、他のコンテンツと完全に同じか非常によく似たコンテンツのかたまりのことです。
同じドメイン内でも異なるドメイン間のコンテンツ同士であっても、どちらにも該当します。
検索エンジンは、URLが完全に一致していないページを、それぞれ別のページと見なします。
自らが意図してコピーコンテンツを作ったりすれば、それが重複コンテンツになるだろうことは想像がつきます。
しかし、重複コンテンツの認識がないまま問題が起きていることもあります。
例えば、CMSによって複数パターンのURLが生成されていることに気付かなかったり、PCとモバイルのサイト間での関連付け(アノテーション)ができていないと言ったことも該当します。
重複コンテンツの発生要因は多岐に渡るため、サイトの適切な管理と対策をしていくことが大切です。
重複コンテンツがSEOに与える影響
重複コンテンツの存在が、どのようにSEOと関係しているのでしょうか?
大きくは以下の3つの影響があります。
正規ページ1つだけを検索結果に表示
Googleが重複コンテンツを発見すると、それらの中から代表となるURLを選んでインデックスに登録します。インデックスされる代表ページのことを正規ページと言います。
正規ページ以外の重複コンテンツは、原則として検索結果に表示されなくなります。
どのURLを正規ページとするかは、Googleがアルゴリズムを用いて、最も有用そうなページを判断し選びます。
これは自分で対策をしなければの話なので、登録したいURLのバージョンを指定することはできます。
なぜ重複コンテンツはまとめられ、1つだけ表示されるのかと言うと、検索結果に同じコンテンツをいくつも並べてもユーザーにとって有益な検索体験を提供できないからです。
検索結果にあるリンクをクリックして、違うページに飛んだにもかかわらず、コンテンツはどこも同じものだったら、非常にストレスが溜まりますよね。
実際、パンダアップデート以前は重複コンテンツの多い検索結果を見る機会が多かったことを私も記憶しています。特に、アフィリエイトサイトで顕著でした。
独自のコンテンツが検索結果に表示されれば、そこにある程度の多様性が生まれます。
検索結果に多様性があれば、ユーザーは画一的ではない情報を得られるので、検索行動の価値が向上します。
これが検索結果で正規ページのみを表示させる最大の理由です。
そっくりなコンテンツは1つあれば十分ということですね。
検索順位の低下
重複コンテンツをたくさん保有していると、順位が下がることがあります。
これは、重複が増えるほど固有の情報を持つページの割合が相対的に少なくなるためです。
あるいは、内容の薄いページが重複することで低品質ページが増えていくからです。
重複コンテンツは、クローラーに影響を及ぼすこともあります。
サイトに割り当てられるクロールの予算(クロールバジェット)を重複コンテンツが消費してしまい、本当にクロールされるべきページが十分にクロールされなくなる、と言った状況を招く可能性です。
クローリングに影響があれば、その次のプロセスのインデキシングにも影響してしまいますね。
規模の大きいサイトほど、順位への影響も懸念されます。
被リンク効果の分散
リンクを受けるURLが違えば、たとえ同一のコンテンツであろうと各URLごとの被リンクとして処理されます。
同じコンテンツなのであれば、被リンクも一箇所集まる方が数が多くなる分、SEO効果は高くなりますね。
このように、重複コンテンツがあることで本来得られるはずの被リンクが分散してしまう可能性が出てきます。
リンクだけでなくアクセスもバラけてしまいますね。
ユーザーは自分がページに訪れた時のURLをリンクに設定しますから、どのバージョンのURLを利用されたとしても、リンクシグナルが統合されるようにしておく必要があります。
重複コンテンツとペナルティ
サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。
重複するコンテンツ – Search Console ヘルプ より
『重複コンテンツによってペナルティを受ける』と言われることがあります。
これはペナルティという言葉をどう解釈するかによりますが、Googleが手動で制裁を加えることをペナルティとするのであれば、一般的な重複コンテンツはペナルティの対象外です。
例えば、正規ページのみ検索結果に表示されたり、重複が多くてランキングに悪影響が出るなどの現象は、Googleのアルゴリズムによる自動的な処理の結果であり、個々のサイトに対して特別な制裁措置をとっているわけではありません。
『順位が下がる要因になるなら、それはペナルティ』とやや強引な解釈をするならば、重複コンテンツはペナルティと言うこともできるかもしれません。
ただ、Googleからしてみれば、単純に重複コンテンツに価値はないので適切に処理したいだけのことです。
私たちサイト運営者は、どうしてもサイトの順位ばかりを気にしてしまいますが、それと同じように、Googleがいつも気にしているのは、ユーザーの検索体験の向上なのです。
もちろん、SEOのために不正に重複コンテンツを作っていた場合は、Googleから手動のペナルティを受けることになります。
これについては「重複コンテンツだから」と言うよりも、「Googleの定める品質に関するガイドラインに抵触するスパム行為だから」と言う方が正しいでしょう。
ガイドラインでは、オリジナルのコンテンツがほとんど存在しないページや無断複製されたページなどを作成しないように注意を呼びかけています。
いずれにせよ、重複コンテンツを放っておくのはSEOにとって好ましくないのは確かですね。
重複コンテンツの判定基準
コンテンツが増えてくると『これは重複コンテンツに該当するだろうか?』と思う時があるかもしれません。
実際のところ、重複コンテンツの基準あるいは境界線はどこにあるのでしょうか?
言わずもがな、盗用・複製・コピペによる継ぎ接ぎのコンテンツ、はNGですね。
他にも「て・に・を・は」を変更した程度、あるいは、構造や展開がそっくりで言葉や表現を変えただけの類似コンテンツもアウトです。
特に説明するまでもありませんね。
では、部分的な重複コンテンツの場合はどうでしょうか?
例えば、出典を明記し、引用としてテキストをコピーするのは、一般的な表現の範囲内ですね。
それから、定型文を複数ページで使いたいこともあるかもしれません、
他のページと文章の主旨が部分的によく似てしまうこともあるでしょう。
実はこれらも重複コンテンツに該当します。
しかし、こういった重複は必ずしも悪いことではありません。
ユーザーあるいは特定の誰かに不利益を与えるものでもありません。
このように、厳密に見ていけば、重複コンテンツを完全に排除することは難しく、かえってコンテンツが作りづらくすることさえあります。
どんなサイトも少なからず重複コンテンツを持っていておかしくないし、あらゆるサイトを見ているGoogleはそれを理解しています。
かと言って、Googleが具体的なボーダーラインを教えてはくれません。
悪用する人が必ず出てくるので当然ですが…
結論としては、残念ながら、重複コンテンツにあたるかどうかの明確な線引きはわからないと言うのが結論です。
要は、程度の問題です。
重複と言えども、常識の範囲内で発生することを気にしすぎることはありません。
客観的に見て、妥当性や必然性のある重複なのかを判断しましょう。
ただし「自分にとっての常識」で考えないでください(笑)。
重複コンテンツは避けて通れない
重複コンテンツ問題は非常に広範囲に及びます。
細かい部分で重複コンテンツを完全に失くすことは難しいし、そこまで考えること自体あまり意味はないかもしれません。
しかし一方で、できるだけ重複しない方が良いことも事実です。
SEOを意識するなら避けては通れない問題なので、きちんと理解して対策をしていきたいものですね。
コメントをどうぞ