Data Domain 软件 :“filesys show space (df)”报告的使用量与sfs_dump总数之间的差异
Summary: 一些客户将“sfs_dump”报告的所有文件的“post-lc-size”(压缩后大小)相加,并期望它与“filesys show space”(df) 报告的空间利用率相匹配。由于这两个值不匹配,因此他们可以将差异视为“缺失或未说明的空间”
Instructions
仅当从未在文件系统上执行过删除时,“sfs_dump”报告的所有文件的压缩后大小总和将与总空间利用率匹配。这在生产 DDR 上从来都不是,因此使用“sfs_dump”来说明当前空间利用率是一种谬误。我们将在下面通过一个例子来说明这一点。
插图:
这可以通过一个简单的三步示例轻松看出:
- 我备份了一个 10G 的文件 (file1)。假设这是一个全新的包装盒,无需进行重复数据消除。因此,压缩后的大小也在 10G 左右。
# sfs_dump /data/col1/test/ /data/col1/test/file1: mtime:1503023531690895000 fileid:18尺寸:10736790004类型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:0 (0%) pre_lc_size:10772785048 post_lc_size:10942680452 (102%) 模式:02000100644
如上所示,压缩后大小为 10G。
II. 接下来,我备份另一个 10G 文件 (file2)。 这与 file1 非常相似或相同。
# sfs_dump /data/col1/test /data/col1/test/file1: mtime:1503023531690895000 fileid:18尺寸:10736790004类型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:0 (0%) pre_lc_size:10772785048 post_lc_size:10942680452 (102%) 模式:02000100644 /data/col1/test/file2: mtime:1503023531690895000 fileid:19尺寸:10736790004类型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:1282587 (100%) pre_lc_size:0 post_lc_size:0 (0%) mode:02000100644
如上所述,file2 没有占用额外的空间,因为它使用 file1 进行了完全重复数据消除。
III. 现在,我删除了 File1 并再次在 mtree 上运行“sfs_dump”。
# sfs_dump /data/col1/test /data/col1/test/file2: mtime:1503023531690895000 fileid:19尺寸:10736790004类型:9 seg_bytes:10772785048 seg_count:1282587 redun_seg_count:1282587 (100%) pre_lc_size:0 post_lc_size:0 (0%) mode:02000100644
基于上述情况,客户可能期望不应在文件系统上占用任何空间。 mtree 中的唯一文件在压缩后占用 0 字节(sfs_dump 报告的所有文件的总和为 0 字节)。 但这是一个谬论。系统上的空间利用率实际上是 10G,由 df 准确反映。
这是因为 File2 引用了最初由 File1 写入的所有段。 删除 File1 不会释放任何内容。“sfs_dump”不显示原始 File1,因为它已被删除。
# df 活动层: 资源大小 使用的 GB 可用 GB GB 使用% 可清理 GB* ---------------- -------- -------- --------- ---- -------------- /data: pre-comp - 10.0 - - - /data: post-comp 129479.5 10.7 129468.8 0% 10.2