クロールバジェット
クロールバジェット (Crawl Budget) は、Googlebot が特定サイトに対して一定期間内にクロールする URL 数の上限のことです。サイト規模・サーバー応答速度・コンテンツ価値で決定されます。
詳細解説
クロールバジェットは、Google が公式に2017年のブログ投稿で説明した概念で、Googlebot が1サイトに対して使うクロールリソースの総量を指します。決定要因は、1) Crawl Rate Limit (サーバー応答速度・エラー率からの上限)、2) Crawl Demand (コンテンツの新鮮さ・人気度・更新頻度)、です。Google は「数千 URL 以下のサイトは気にしなくてよい、100万 URL 超の大規模サイトのみ最適化が必要」としています。最適化手法は、a) robots.txt で重複/低価値 URL をブロック、b) パラメータ付き URL をカノニカル統合、c) サイトマップで重要 URL を明示、d) 410 Gone で削除済みページを早期インデックス削除、e) サーバー応答速度を200ms 以下に維持、です。Search Console の「クロールの統計情報」で日次クロール数とレスポンスを監視できます。
実装例 / 使い方
- 01100万 URL 超の EC サイトは商品在庫切れページの410返却でクロール効率改善します
- 02ファセットナビゲーションを robots.txt で制御しクロールバジェットを節約します
- 03サーバー応答が500ms 超ならクロール頻度が制限されます
関連する用語
robots.txt
robots.txt は、Web サイトのルート (/robots.txt) に配置するテキストファイルで、検索エンジンや AI クローラーに「どの URL を...
sitemap.xml
sitemap.xml は、サイト内の全ページ URL とその更新日・優先度を一覧化した XML ファイルで、検索エンジンに効率的なクロールを促します。Goog...
インデックス
インデックス (Indexing) は、検索エンジンがクロールしたページを解析し、検索可能なデータベースに登録する処理のことです。インデックスされていないページ...
カノニカル URL
カノニカル URL は、同一/類似コンテンツが複数 URL で存在する場合に「正規版」を検索エンジンに伝える指定のことです。<link rel="canonic...
De-indexing
De-indexing (デインデックシング) は、検索エンジンのインデックスから特定ページや全サイトが削除されることです。意図的な削除と、ペナルティによる強制...
クロールバジェットを、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
