sitemap.xml
sitemap.xml は、サイト内の全ページ URL とその更新日・優先度を一覧化した XML ファイルで、検索エンジンに効率的なクロールを促します。Google・Bing 共通仕様で sitemaps.org で標準化されています。
詳細解説
sitemap.xml は Google・Yahoo・MSN が2005年に共同制定したクロール支援フォーマットで、現在は sitemaps.org で仕様管理されています。各 URL に loc (URL)、lastmod (最終更新日)、changefreq (更新頻度)、priority (優先度0.0-1.0) を記述します。1ファイルあたり最大50,000 URL/50MB 制限があり、超過時はサイトマップインデックスで分割します。配置場所は通常ルート (https://example.com/sitemap.xml) で、Search Console と Bing Webmaster Tools で送信、robots.txt に Sitemap: ディレクティブで明示するのが標準実装です。動的サイトでは XML 自動生成プラグイン (WordPress なら Yoast SEO・RankMath) や Next.js の next-sitemap パッケージで運用します。lastmod の精度が高いほどクロール効率が上がるため、CMS の更新日と連動させる実装が推奨されます。
実装例 / 使い方
- 01Search Console にサイトマップ送信するとインデックス速度が2-3倍速まります
- 025万 URL 超のサイトはサイトマップインデックスで分割管理します
- 03lastmod を正確に出力することで再クロール頻度が最適化されます
関連する用語
robots.txt
robots.txt は、Web サイトのルート (/robots.txt) に配置するテキストファイルで、検索エンジンや AI クローラーに「どの URL を...
インデックス
インデックス (Indexing) は、検索エンジンがクロールしたページを解析し、検索可能なデータベースに登録する処理のことです。インデックスされていないページ...
クロールバジェット
クロールバジェット (Crawl Budget) は、Googlebot が特定サイトに対して一定期間内にクロールする URL 数の上限のことです。サイト規模・...
カノニカル URL
カノニカル URL は、同一/類似コンテンツが複数 URL で存在する場合に「正規版」を検索エンジンに伝える指定のことです。<link rel="canonic...
hreflang
hreflang は、多言語/多地域サイトで「このページは日本語版/英語版/米国向け/英国向けである」と検索エンジンに伝える HTML 属性です。<link r...
sitemap.xmlを、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
