Data Domain 軟體:“filesys show space (df)”所報告的用量與sfs_dump總數之間的差異
Summary: 有些客戶將「sfs_dump」報告的所有檔案的「post-lc-size」(壓縮後大小)相加,並期望它與「filesys show space」(df) 所報告的空間使用率相符。由於這兩個值不匹配,因此它們可以看到“缺少或未考慮的空間”的差異
Instructions
只有在 檔案系統上從未執行過刪除時,「sfs_dump」報告的所有檔案壓縮後大小總和才會符合總空間使用率。這在生產 DDR 上從來都不是這種情況,因此使用「sfs_dump」來說明當前的空間使用率是一個謬誤。我們將通過下面的示例來說明這一點。
插圖:
這可以通過一個簡單的三步示例輕鬆看出:
- 我備份了一個 10G 的檔(檔 1)。假設這是一個全新的盒子,沒有什麼可以刪除重複的。因此,壓縮後的大小也在 10G 左右。
# sfs_dump /data/col1/test/ /data/col1/test/file1: mtime:1503023531690895000 fileid:18尺寸:10736790004類型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:0 (0%) pre_lc_size:10772785048 post_lc_size:10942680452 (102%) 模式:02000100644
如上所示,壓縮後的大小為 10G。
II. 接下來,我備份另一個 10G 檔 (file2)。 這與 file1 非常相似或相同。
# sfs_dump /data/col1/test /data/col1/test/file1: mtime:1503023531690895000 fileid:18尺寸:10736790004類型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:0 (0%) pre_lc_size:10772785048 post_lc_size:10942680452 (102%) 模式:02000100644 /data/col1/test/file2: mtime:1503023531690895000 fileid:19尺寸:10736790004類型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:1282587 (100%) pre_lc_size:0 post_lc_size:0 (0%) 模式:02000100644
如上所示,file2 不會佔用額外空間,因為它使用檔 1 完全刪除了重複數據。
III. 現在我要刪除 File1,並再次在 mtree 上執行「sfs_dump」。
# sfs_dump /data/col1/test /data/col1/test/file2: mtime:1503023531690895000 fileid:19尺寸:10736790004類型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:1282587 (100%) pre_lc_size:0 post_lc_size:0 (0%) 模式:02000100644
根據上述情況,客戶可能預期檔案系統上不會佔用任何空間。 mtree 中唯一的檔案在壓縮後佔用 0 位元組 (sfs_dump 報告的所有檔案總和為 0 位元組)。 但這是一個謬論。系統上的空間利用率實際上是 10G,由 df 準確反映。
這是因為 File2 會參考最初由 File1 寫入的所有區段。 刪除 File1 不會釋放任何資源。「sfs_dump」不會顯示原始的 File1,因為它已被刪除。
# df 作用層: 資源大小 GiB 已使用 GiB 可用 GiB Usage% 可清理 GiB* ---------------- -------- -------- --------- ---- -------------- /資料: 壓縮前 - 10.0 - - - /數據: 後補償 129479.5 10.7 129468.8 0% 10.2