下記は「Google ウェブマスターアカデミー 2.GOOGLEによるサイトの認識方法を学ぶ」の内容を、私の学習用に超簡略化して書き直したものです。
既存からあるサイトであれば下記が考えられる。
GOOGLEによるサイトの認識方法を学ぶ
GOOGLE検索の仕組みを知る
- 検索インデックスはスパイダーと呼ばれるプログラムがリンクを辿ることで作成される。
- 検索キーワード(クエリ)に該当するページを200以上の条件から評価し順位を付けている。
- キーワードがそのページに何回含まれているか?
- そのキーワードはタイトル/URLに現れているか?
- キーワード同士、隣接して現れるのか?
- キーワードの類義語が含まれているか?
- そのページを所有するウェブサイトの品質は高いか?スパムではないか?
- PageRankはどれくらいか?
- 検索結果としてタイトル、URL、スニペット、類似ページ、最新ページへのリンク、関連するキーワードが表示される。
サイトがインデックスに登録されていることを確認する
サイトがインデックスに登録されていることの確認方法
ドメイン名の頭に「site:」を付けて検索し、ページが表示されれば登録されている。(例:「site:mydomain.com」で検索)- 新しいサイトで、まだクローラーから発見されていない。
既存からあるサイトであれば下記が考えられる。
- サイトがrobots.txtでクローラをブロックしている。
- 「ウェブマスター向けガイドライン」に違反している。
- 最近取得したドメインの場合、以前あったサイトがスパムでブロックされていた。
サイトのコンテンツを説明する
- 長すぎず簡潔で固有の分かりやすいタイトルを付ける。
- 適切なmetaタグを設定する(description等)
- 画像にはalt属性とキャプションを付け内容を検索エンジンに理解させる。
- Google のウェブマスター向けガイドラインを遵守する
Google のウェブマスター向けガイドラインを遵守する
以下は「Googleのウェブマスター向けガイドライン」の概略デザインとコンテンツ
- コンテンツやリンクは画像ではなくテキストを利用し検索エンジンに理解させる。
- 検索されるキーワードをサイトに含める。
- リンク切れは修正する。
技術
- robots.txtは価値の無いページへのクロールを防ぐファイル。不要なら設置しない。
- 「robots.txtテスター」で設定ミスが無いか確認すること。
品質
- 検索エンジンではなく、ユーザーに向けて質の高いコンテンツを作成し、不正なSEOを避ける。
検索エンジン最適化について学ぶ
- 「ウェブマスター向けガイドライン」に準拠したホワイトハット(正当な)SEOを行う。
- 検索エンジンを欺くブラックハット(不正な)SEOは利用しない、利用したSEO業者も避ける。
- 「検索エンジン最適化スターターガイド」や「検索エンジン最適化」の記事を参考にする。