本ページでは、本環境におけるバックアップ取得状況の確認方法をまとめる。
バックアップは取得しているだけでは不十分であり、正常に取得され続けていることを確認して初めて運用として成立する。
本環境では、バックアップを NAS に集約し、差分バックアップを前提とした構成としているため、その特性を踏まえた監視を行う。
日常運用では、cron の実行状況、バックアップファイルの更新、ログ、容量などを継続的に確認し、異常の早期検知につなげる。
本環境では、バックアップ監視を次の考え方で実施する。
バックアップ先は NAS に統一し、確認対象を一箇所に集約する。
バックアップは cron による自動実行を前提とし、実行状況を確認する。
ファイルバックアップは差分方式のため、更新有無をもって正常性を判断する。
あわせて、ログおよびストレージ容量を確認し、障害の兆候を見逃さないようにする。
必要に応じて監視ツールと連携し、自動通知による検知を行う。
| サーバー名(仮称) | 役割 |
|---|---|
| WEBサーバー(仮称) | Apache / Wiki.js |
| 監視サーバー(仮称) | Zabbix |
| NAS(仮称) | バックアップ保存先 |
バックアップ処理の成否だけでなく、その後の更新状況や保存領域の状態まで含めて確認することで、継続的な正常性を判断する。
バックアップ処理が cron により実行される設定になっているかを確認する。
crontab -l
0 2 * * * /usr/sbin/rear mkbackup
30 2 * * * rsync -av --delete /var/www/ /backup/web/
0 3 * * * mysqldump -u root -p wiki > /backup/db/wiki.sql
OS、ファイル、データベースのバックアップがそれぞれ定義されていることを確認する。
設定が存在しない場合、バックアップ自体が実行されないため最優先で確認する項目となる。
バックアップデータが保存されていることを確認する。
ls -lh /backup
バックアップファイルが存在していることに加え、更新日時が直近の実行時刻と一致していることを確認する。
ファイルが存在しない、または更新されていない場合は、バックアップ処理の異常が考えられる。
ファイルバックアップの更新状況を確認する。
ls -l /backup/web/
更新日時が最新になっていることを確認する。
差分バックアップでは変更されたファイルのみが更新されるため、すべてのファイルが更新されるわけではない。
更新が長期間行われていない場合は、rsync の失敗や cron の未実行などを疑う。
差分方式では「更新があるかどうか」が重要な判断材料となる。
バックアップ処理のログを確認する。
journalctl -u rear
または
cat /var/log/rear/rear.log
エラーが出ていないこと、処理が正常に終了していることを確認する。
異常がある場合はログ内容をもとに原因を切り分ける。
バックアップ保存領域の使用状況を確認する。
df -h
Filesystem Size Used Avail Use%
/backup 500G 120G 380G 24%
空き容量が不足するとバックアップ処理は失敗する。
そのため、容量の推移を把握し、余裕を持った状態を維持することが重要となる。
バックアップが複数世代保持されていることを確認する。
単一世代のみのバックアップでは、誤削除や破損に対応できない。
過去のバックアップが適切に残っていることを確認することで、復旧の選択肢を確保できる。
監視サーバーと連携し、バックアップ異常を自動検知する。
バックアップファイルの更新日時
ログ内のエラー検知
ストレージ容量の閾値監視
手動確認のみでは見落としが発生しやすいため、監視ツールによる自動検知を組み合わせることで、異常を早期に把握できる。
日常運用では、以下の観点を定期的に確認する。
cron が正常に実行されていること
バックアップファイルが更新されていること
差分バックアップが機能していること
ログにエラーが出ていないこと
バックアップ領域に十分な空きがあること
これらを継続的に確認することで、バックアップの信頼性を維持できる。
NAS に障害が発生した場合、バックアップおよび復旧の両方が影響を受ける。
そのため、バックアップ基盤自体の監視も重要となる。
また、差分バックアップを前提とする場合は、世代管理が適切に行われていることが前提となる。
ログ確認を怠ると異常に気付けないため、定期的な確認を習慣化することが重要である。
本構成では、バックアップを NAS に集約し、差分バックアップを前提とした監視を行う。
cron、ログ、容量、差分更新を継続的に確認することで、バックアップの正常性を維持する。
バックアップは取得しているだけではなく、正常に取得されていることを確認して初めて有効となる。