PowerProtect DP 系列:保护存储:Data Domain:自动清理
Summary: 仅当预测引擎确定已用容量在配置的时间内超过配置的百分比时,才会运行“启用了预测的自动清理”。
Instructions
什么是自动清理?
启用了预测的自动清理可补充现有的清理引擎。自动清理功能会预测系统容量,当系统预测其在特定时间段内将达到特定的容量使用水平时,此功能允许清理自动启动,而不是完全依赖基于时间的清理计划,后者通常不考虑容量使用情况或系统活动。
哪个操作系统版本中引入了自动清理?
融合备份一体机 2.7.x 中集成的 DD OS 7.6.x 引入了启用了预测的自动清理。
自动清理仅适用于活动层。
提醒:此功能默认禁用。可以根据要求进行配置。
传统或定期清理流程有哪些缺点?
- DD 清理或垃圾数据收集 (GC) 是长时间运行的过程,并且还会延迟相互排斥的过程,例如云清理。
- 它占用大量资源。接收或 REPL 性能可能会受到影响。
- GC 会导致数据碎片化,在内部往往会降低数据局部性并随着时间的推移影响读取性能,从而影响恢复性能。
- GC 是按计划运行的,即使不需要也会运行(这样的场景包括:系统容量还较为富裕,备份保留时间较长,一周内没有太多备份到期)。
- GC 可能是 I/O 密集型操作,并且可能与接收竞争。
- 磁盘寿命可能会受到重复 I/O 的影响。
自动清理有哪些优势?
- 使用自动清理时,GC 仅在需要时运行,因此能够更高效地利用资源。
- 减少清理周期数可减少数据碎片,并提高读取或还原性能。
- 如果预测表明未来 n 天内系统使用的容量不会超过 x,则会跳过计划的活动层清理,但会在内部将其标记为成功,这样如果计划运行云清理,云清理可以启动。
自动清理背后的概念是什么?
- 自动清理使用预测引擎。
- 预测引擎是 Data Domain 文件系统内的一个线程,每小时运行一次。
- 收集写入的物理字节并存储这些容量记录。
- 在收集 10 个此类容量记录后,可以进行容量预测。
- 将容量使用历史记录保存在循环缓冲区中。
- 默认情况下,它会保留 756 条记录(即一个月的每小时容量使用记录)。
- 预测引擎使用线性回归模型
未来容量 = 当前容量 + (接收速率 * 时间)
自动清理有哪些不同类型?
- 计划的自动清理,即跳过计划
- 完全自动清理,即自动计划
提醒:一次只能设置一种类型的自动清理(跳过计划或自动计划)。
这两种类型的自动清理的区别是什么?
| 计划的自动清理,即跳过计划 | 完全自动清理,即自动计划 |
| 在具有云层的系统上受支持 | 在具有云层的系统上不受支持 |
| 必须存在定期或传统清理计划。 | 设置自动计划后,定期清理计划将自动被禁用。 |
| 如果预计在配置的天数内系统已用容量会超过配置的百分比,则将跳过定期计划清理。 | 仅当计划已用容量预计会在配置的天数内超过配置的百分比阈值时,才会运行清理。 |
| 当跳过计划被禁用或重置时,正常清理计划将保持原样。 | 当自动计划被禁用或重置时,必须手动设置正常的清理计划。 |
观看 YouTube 视频
用于设置自动清理的命令是什么?
- 计划的自动清理,即跳过计划
filesys clean skip schedule { [days <day(s)> estimate-percent-used <percent>] | show | reset }
在定期清理计划应该运行时,如果预测表明系统已用容量在未来 10 天内不会增长到 90% 以上,则会跳过清理。配置步骤如下:
- 验证是否存在定期清理计划,并确保其未设置为“never”。
# filesys clean show schedule
如果定期清理计划不存在或设置为“never”,则使用下面的语法进行设置或使用 DD UI 路径,如下所示:
CLI 语法:
filesys clean set schedule { daily <time> | <day(s)> <time> | biweekly <day> <time> | monthly <day(s)> <time> }
或者
登录 DD GUI > Data Management > Filesystem > 单击右侧的“Settings”齿轮图标 > 转至“Cleaning”选项卡 > 选择“Frequency”“Time & day”。
# filesys clean skip schedule days 10 estimate-percent-used 90
要显示当前的跳过计划配置
# filesys clean skip schedule show
要禁用跳过计划
# filesys clean skip schedule reset
- 完全自动清理,即自动计划
filesys clean auto schedule {[days <day(s)> estimate-percent-used <percent>]|[interval-days <days>]|show | reset }
示例:
如果要求是预计系统已用容量在未来 10 天内会增长到 85% 以上时运行清理,设置方法如下:
# filesys clean auto schedule days 10 estimate-percent-used 85
输出:如果系统已用空间预计在未来 10 天内会增长到 85% 以上,则运行自动计划的清理。
两次自动计划的清理之间的最短间隔设置为七天。
提醒:默认情况下,连续两次自动清理之间的最短间隔为七天。
您也可以使用“interval-days”选项对此进行更改和定义,如下所示:
# filesys clean auto schedule days 10 estimate-percent-used 85 interval-days 5
输出:如果系统已用空间预计在未来 10 天内会增长到 85% 以上,则运行自动计划的清理。
两次自动计划的清理之间的最短间隔设置为五天。
提醒:设置自动计划后,将自动禁用定期清理计划,如下所示:
# filesys clean show schedule
Filesystem cleaning is scheduled to run "never".
— 要显示自动计划清理的当前配置
# filesys clean auto schedule show
— 要禁用自动计划
# filesys clean auto schedule reset
提醒:禁用自动计划清理后,必须手动设置定期清理周期,如下所示:
CLI 语法:
filesys clean set schedule { daily <time> | <day(s)> <time> | biweekly <day> <time> | monthly <day(s)> <time> }
或者
UI:登录 DD GUI > Data Management > Filesystem > 单击右侧的“Settings”齿轮图标 > 转至“Cleaning”选项卡 > 选择“Frequency”“Time & day”。
有关更多详细信息,请参阅 Solve Desktop 中相应操作系统的 DD OS 管理指南。