Data Domain:在 DDR 上计划清理
Summary: 本文概述了文件系统清理作。此作回收 Data Domain 文件系统中已删除对象占用的物理存储。
Instructions
在 Data Domain 系统上计划清理
目的:
而 filesys clean 作回收 Data Domain 文件系统中被已删除对象占用的物理存储。
当应用程序软件使备份数据或归档映像过期时,它们将无法访问或无法恢复,但仍会占用物理存储。
仅有一款 filesys clean 作将回收已删除且快照中不存在的文件所使用的物理存储。文件系统可能永远不会报告 100% 已清理。清理后的总空间可能始终比 100 小几个百分点。
适用对象:
- 所有 Data Domain 系统
- 所有软件版本
- 清洁
解决方案:
Data Domain 建议在首次完整备份到 Data Domain 系统后运行 清理 作。完整备份上的初始本地压缩通常为 1.5 到 2.5 倍。即时 清理 作将提供系数为 1.15 到 1.2 的额外压缩,并回收相应数量的磁盘空间。
默认计划在每周二早上 6 点运行 清理 作 (tue 0600),且采用 50% 限制。
要提高文件系统可用性,并且如果 Data Domain 系统的磁盘空间不短缺,请考虑更改计划以降低清理频率。
-
如果系统已填满,则不应使用将默认值更改为更频繁或更激进的清理周期来弥补这一点。每天运行清理将对数据碎片化。例如,读取速度可能会严重受损。全局压缩算法依赖于写入期间的良好局部性,因此过于频繁的清理周期会导致重复数据消除数量下降。
-
清理是一种文件系统作,在文件系统运行时会影响整体文件系统性能。将清理限制从默认值 50 调高会影响活动清理周期内的性能,因为清理过程会消耗更多资源。
-
更改本地压缩算法会导致以下清理周期运行更长时间,因为必须读取、解压缩并再次压缩所有现有数据。
-
任何关闭 Data Domain 系统文件系统或关闭设备的作(系统关机、重新启动或
file system disable命令)停止清理作。当系统和文件系统再次启动时,清理 不会 自动继续。 -
Data Domain 之间的复制可能会影响
filesys clean工厂发货的。如果源 Data Domain 在禁用或断开连接时接收大量新数据或更改的数据,则恢复复制速度可能会显著减慢filesys clean工厂发货的。 -
如果目录复制在后面运行,例如由于复制对之间的网络带宽不足(导致复制滞后),则清理可能无法完全运行。这种情况需要复制中断(并在清理运行后重新同步)或复制滞后以跟上(例如增加网络链接或向源目录写入更少的新数据)。
已满的 Data Domain 可能需要多次清理作来清理 100% 的文件系统,尤其是在连接了多个外部盘架时。
根据存储的数据类型,例如使用特定备份软件的标记时(filesys option set marker-type ...),文件系统可能永远不会报告 100% 已清理。
清理后的总空间可能始终比 100 小几个百分点。
使用集合复制时,清理作不会在目标上运行。
使用目录复制时,必须在源和目标 Data Domain 上运行清理作。
要显示清理作的当前日期和时间,请执行以下作:
filesys clean show schedule
Filesystem cleaning is scheduled to run "Tue" at "0600".
要显示清理作的限制设置,请执行以下作:
filesys clean show throttle
50 Percent Throttle
要更改限制设置,请执行以下作:
filesys clean set throttle <value>
其中的值为 0(最慢)到 100(最快)
(对限制设置的更改在不重新启动清理的情况下生效)
示例:
filesys clean set throttle 75
该命令不生成输出,因此必须重新运行“show throttle”命令:
filesys clean show throttle
75 Percent Throttle
要更改清理计划,请执行以下作:
filesys clean set schedule <schedule-to-start-cleaning>
<schedule-to-start-cleaning> 是:
-
-
-
never- 关闭清理过程,并且不采用限定符。
-
daily <time>- 每天在指定时间运行作 (不推荐)
- 时间是 24 小时军事时间。2400 不是有效时间。
mon0000 是星期日晚上和星期一早上之间的午夜。
-
<day or days> <time>- 在给定时间的一个或多个给定日期上运行 - 日名称 是三个字母(例如
mon星期一)。在天数之间使用连字符 (-)。例如:tue-fri - 时间是 24 小时军事时间。2400 不是有效时间。
mon0000 是星期日晚上和星期一早上之间的午夜。
- 在给定时间的一个或多个给定日期上运行 - 日名称 是三个字母(例如
-
biweekly <day> <time>- 在给定的一天或每两周的给定时间开始
- 时间是 24 小时军事时间。2400 不是有效时间。
mon0000 是星期日晚上和星期一早上之间的午夜。
-
monthly <day or days> <time>- 在给定的一天或几天(从 1 到 31)的给定时间开始
- 时间是 24 小时军事时间。2400 不是有效时间。
mon0000 是星期日晚上和星期一早上之间的午夜。
-
-
示例:
要在每周二下午 4 点运行清理:
filesys clean set schedule tue 1600
Filesystem cleaning is scheduled to run "Tue" at "1600".
要在每月 1 日和 15 日下午 3 点运行该作,请执行以下作:
filesys clean set schedule monthly 1,15 1500
Filesystem cleaning is scheduled to run "1, 15" at "1500".
要将清理计划设置为默认的星期二早上 6 点(星期二 0600)以及默认限制 50%,请使用 reset 命令:
filesys clean reset all
该命令不生成任何输出。
命令不生成输出,因此必须重新运行“show throttle”和“show schedule”命令:
filesys clean show throttle
50 Percent Throttle
filesys clean show schedule
Filesystem cleaning is scheduled to run "Tue" at "0600".