インデックスとは?
インデックスとは検索エンジンのデータベースにウェブページが登録されることです。
ウェブページがインデックスされることによって検索エンジンを使用したときに検索を行った結果、そのウェブページが出てくるようになります。
インデックスの流れ
- 検出
- クロール
- レンダリング
- インデックス
検出
ウェブページのURLの検出を行います。この場合、基本的には記事単位やページ単位でURLの把握を行います。ただし、URLの末のスラッシュ(/)のある無しやwwwがある無いなどは別ページとして判断されます。
クロラ―が回ってきますが、そのクローラーがページ(URL)を見つけれるようにページの設置を行っておく必要があります。
ページを見つけれるようにする方法としては、内部リンクや外部リンク、XMLサイトマップがメインの手法となります。
特に立ち上げたばかりの新規サイトであれば、外部リンクがないため、内部リンクの設置やXMLサイトマップの設置が有効になります。
クロール
クロラ―がURLを発見(検出)された後はクロールがあります。この工程ではクローラーがページの情報を取得していきます。
その際にrobots.txtでの制御や不要なページの削除など不要のクロールを行わないように行う必要があります。不要なクロールを行ってしまうことによって、別のページがインデックスされたり、1日のクロール量を消費してしまって重要なページにクローラーが回りにくくなるといったようなデメリットがあります。
レンダリング
検索エンジンの方でページをインデックスさせて問題がないという判断を行った場合、レンダリングでページを見れるように描画させる作業を行います。
インデックス
これらの3つの工程が終わってからインデックスされます。
インデックスは全てのページがインデックスされるわけではありません。インデックスされない理由には次のようなものがあります。
- 低品質コンテンツ
- レンダリングが正常に行えなかった
- 404ページ
- noindexタグが付いていた
これらがあると正常にインデックスを行えないため、必ず確認を行う必要があります。
また、Googleでは年々インデックスをよりむ図かしくさせているため、必ずインデックスされるわけではありません。
インデックス数とSEOの関係
インデックスが多くてもSEOに効果的とは限らない
インデックス数が多くてもSEOに効果的とは限りません。
これはインデックスされてるページであっても低品質コンテンツと認識されている場合があるためです。
低品質ページを大量にインデックスされたとしてもそのページ、サイトとしての評価が上がってくることはありません。
インデックスさせない方法もある
ウェブページを全てインデックスさせる必要はありません。インデックスをあえてさせないといった方法もあります。インデックスさせないためにはrobots.txtでのクローラーのブロックやnoindex(ノーインデックス)タグを入れるというものです。
noindex(ノーインデックス)やrobots.txtの使っても必ず良い効果が出るとは限らないので注意しましょう。
コメント