用語集一覧へ
— Glossary
重複排除
読み: じゅうふくはいじょ
短い定義
重複排除 (deduplication) は、同じ内容のデータブロックを 1 つだけ保存することでストレージ容量を削減する技術です。restic / BorgBackup などの現代的バックアップツールが標準採用。
詳細解説
重複排除は固定長または可変長のチャンクごとにハッシュを取り、同一ハッシュのチャンクは参照のみ保存することで実容量を圧縮する技術です。10 個の世代分バックアップでも、変更分だけが新規データとして加算されるため、見た目「フル × 10」でも実容量は「初回 + 変更分」で済みます。restic は CDC (Content-Defined Chunking) を採用しており、ファイル境界に依存せず重複検出が効きます。当方の実例では 16.7GB のデータが R2 上 5GB に圧縮 (圧縮率 2.56x)、世代を増やしても容量が線形に増えません。
実装例 / 使い方
- 01restic backup で 7 世代取っても実容量は初回 × 1.5 程度
- 02ZFS dedup (リソース重い、限定的に使用)
- 03重複排除付きバックアップアプライアンス
— IMPLEMENT
重複排除を、実際に活用する
用語の意味は分かった。次は実装。EXBANK の無料診断で、貴社で具体的にどう活用できるかをご提案します。
営業時間 平日10-18時 / 通常24時間以内に返信
