増分バックアップと差分バックアップの違い


災害対策のみならず、セキュリティインシデント対応時のデータ復旧のためにも、バックアップ運用はとても重要です。
近年、ストレージの大容量化と、マシン性能の向上、AIなどの進化により、処理する対象データは日々増大し、バックアップ対象となるシステムのデータ量も膨大になって来ました。
ディスクストレージのスナップショットやレプリケーションなどのハイレベルな機能を使えば、バックアップのために業務を停止すべき時間を短くさせる技術は進歩してきましたが、バックアップは別のデバイスにコピーすることが基本なので、データ量が多くなれば、それだけバックアップ時間には影響がでます。

従来からあるバックアップの基本的な手法には、フルバックアップの他に、増分バックアップと差分バックアップがあります。 増分と差分は言葉としての違いはとても分かりづらいのですが、バックアップ手法としては、同じ意味ではなく明確に違います。
たとえば日時バックアップを例にとると、1日目にバックアップ対象としたいデータ領域のすべてをデータコピーして、フルバックアップを取得します。 2日目には、1日目にバックアップを取得した時点から変更された部分のみをバックアップ先にデータコピーします。ここまでは、両者とも同じです。
3日目以降に違いが生じ、増分バックアップが前日からの変更分をデータコピーすればよいのに対し、差分バックアップは、1日目からの2日間の変更分をデータコピーします。つまり、増分バックアップは、前回のバックアップ時点からの変更分のみでよいのに対し、差分バックアップは、前回のフルバックアップ時点から変更分をすべてデータコピーすることとなり、保管すべきデータも多くなります。もし1週間のサイクルなら、6日目が、増分より差分の方が最も多くなり、バックアップデータ量の差が一番大きく開きます。
増分と差分バックアップは、どちらもメリット、デメリットを考慮して選択すべきです。 日々のバックアップ時間を短縮したい場合は、増分バックアップの方が有利です。バックアップしたデータを保管するエリアも少なくて済みます。しかしながら、増分バックアップの場合、万が一の復旧作業が発生する場合、フルバックアップから数えて、その増分バックアップがある回数分のリストア作業が必要になります。

こうなると、復旧を迅速に行える体制をとるのであれば、差分バックアップの方が有利になるわけですが、日々バックアップ時間も優先したい場合には、合成バックアップという方法もあります。
合成バックアップは、フルバックアップと増分バックアップのバックアップデータをマージして、ある時点でのフルバックアップを作成してしまうというものです。バックアップデータのみをインプットとしているので、業務側のデータに負荷を与えず、バックアップ時間も気にせずに、フルバックアップの周期を短くできるメリットがあります。フルバックアップと同じデータ領域が必要になるので、ストレージに余裕がないと厳しいですが、運用の仕方によっては、増分バックアップのデメリットだったリストアの手間が減るため、迅速な対応が可能になります。

バックアップにも、さまざまな手法が選択できるようになってきましたが、やはり、業務負荷やストレージコストなどを考慮して、環境に合った最適なバックアップ運用を心掛けることが必要です。


どこからの変更分なのかが、増分と差分バックアップの違い


バックアップ, 運用