インデックス
インデックス (Indexing) は、検索エンジンがクロールしたページを解析し、検索可能なデータベースに登録する処理のことです。インデックスされていないページは検索結果に表示されません。
詳細解説
インデックスは、検索エンジンが Web ページをクロールした後、内容を解析しキーワード・エンティティ・リンク構造などをデータベースに格納する工程です。Google のインデックス処理は、1) HTML パース、2) JavaScript レンダリング (Web Rendering Service による2段階インデックス)、3) コンテンツ抽出と重複除外、4) シグナル抽出 (タイトル・見出し・構造化データ・PageRank)、5) Caffeine インデックスへの格納、で構成されます。インデックス可否は、a) robots.txt で許可されている、b) noindex メタタグがない、c) canonical 指定が自身か空、d) コンテンツ品質が一定基準以上、で決まります。Search Console の URL 検査ツールで個別 URL のインデックス状況を確認でき、「インデックス登録をリクエスト」で再クロールを促せます。新規ページのインデックスは数時間-数週間かかります。
実装例 / 使い方
- 01Search Console URL 検査で「インデックス登録済み」となれば検索表示可能です
- 02noindex メタタグでインデックス除外し、404 ページの誤登録を防ぎます
- 03JavaScript SPA は CSR より SSR/SSG の方がインデックス速度が速いです
関連する用語
De-indexing
De-indexing (デインデックシング) は、検索エンジンのインデックスから特定ページや全サイトが削除されることです。意図的な削除と、ペナルティによる強制...
robots.txt
robots.txt は、Web サイトのルート (/robots.txt) に配置するテキストファイルで、検索エンジンや AI クローラーに「どの URL を...
sitemap.xml
sitemap.xml は、サイト内の全ページ URL とその更新日・優先度を一覧化した XML ファイルで、検索エンジンに効率的なクロールを促します。Goog...
カノニカル URL
カノニカル URL は、同一/類似コンテンツが複数 URL で存在する場合に「正規版」を検索エンジンに伝える指定のことです。<link rel="canonic...
クロールバジェット
クロールバジェット (Crawl Budget) は、Googlebot が特定サイトに対して一定期間内にクロールする URL 数の上限のことです。サイト規模・...
インデックスを、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
