Data Domain:计划的清理无法启动,并发布警告“EVT-GC-00002:无法启动计划的文件系统清理”
Summary: DataDomain 清理 (GC) 计划在特定日期和时间运行。在较新的 DDOS 版本中,当存在任何此类计划并且由于任何原因无法启动清理过程时,系统监视守护程序会注意到这一点,这会发出警报。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
DataDomain 清理(垃圾数据收集,GC)计划在特定日期和时间运行。在 DDOS 6.0.x 及更高版本中,如果存在任何此类计划,并且出于任何原因无法启动清理过程,系统监视守护程序会注意到这一点,并最终发出如下警报:
# alerts show current # alerts show current Id Post Time Severity Class Object Message ----- ------------------------ -------- ----------- --------- ----------------------------------------------------------------------------------------- m0-11 Tue Jun 27 16:32:03 2017 WARNING Filesystem EVT-GC-00002: Unable to start scheduled file system cleaning on Tue Jun 27 16:04:00 2017. ----- ------------------------ -------- ----------- --------- -----------------------------------------------------------------------------------------
此外,还会发送警报 ASUP,其中包含如下详细信息:
Hostname: dd-6800 Location: Lab4_Row_M System SerialNo: APMxxxxxxxxxxxxxx Chassis SerialNo: FCxxxxxxxxxxxxxxx ModelNo: DD6800 Version: 6.0.0.1 Time: Tue Jun 27 16:15:02 2017 Alert Id: m0-11 Event Id: EVT-GC-00002 Event Message: Unable to start scheduled file system cleaning on Tue Jun 27 16:04:00 2017. Event Description: Cleaning has not started as scheduled. Space for deleted files will not be reclaimed until cleaning completes. This may impact the ability to backup. Recommended Action: Determine the reason why cleaning did not start. Manually start cleaning if free space needs to be reclaimed before the next scheduled cleaning. If problem persists, contact your contracted support provider or visit us online at https://support.emc.com.
Cause
警报仅通知存在无法在应该启动的时间启动的计划清理过程。造成这种情况的多种可能原因,其中大多数并不表示存在任何问题。可能触发警报的原因包括:
我们过去看到跳过 GC 的另一个原因(尽管很少见)是注册表中干净计划的不一致。例如,注册表和 CLI 都显示 GC 计划于当地时间星期日上午 06.00 运行:
但是,“crontab”进程计划程序用于启动配置的作业的其他注册表项 (collection.1.crontab.expunge) 不正确,例如:
- 在必须启动计划的清理过程时,DD GC 已在运行。由于在任何给定时间只能运行一个 GC 进程,并且尝试一个进程不会抢占正在运行的 GC,因此跳过了计划的 GC,因此会发出警报
- 与 GC 不兼容的操作,例如,运行从活动存储层到归档存储层的数据移动 (FMIG),或在活动层 GC 即将开始时运行 Cloud Tier 清理
- 以前对系统时区进行的更改可能导致负责计划任务的内部“cron”守护程序仍在旧时区(而不是新时区)上运行,因此,根据以前的时区和当前时区,DD GC 可能会比预期早几个小时或晚几个小时运行,从而引发跳过的 GC 的警报。您可以查看知识库文章 Data Domain:如何修改 Data Domain Restorer (DDR) 上的日期/时间和/或时区, 了解有关 DD 中时区更改的更多详细信息
- 在内部,DD 清理通过将作业提交到内部“sms”守护程序执行“filesys clean start”命令来启动。如果“sms”没有响应,或者 FS 未能按时响应“sms”,GC 将不会启动,并且将被跳过。您可能需要检查“sms.info”日志中是否有匹配的条目,例如这些条目,这表示已尝试清理,但作业无法启动:
02/28 12:00:26.495 (tid 0xa79c040): completed job:操作3278752:sms_filesys_clean_start,持续时间:25067 毫秒,状态:文件系统无响应。
- 与上述内容相同,但由于“时间向后跳转”,cron 的服务未与设置
的新时间同步,我们可以在 ASUP 上找到如下所示的内容:
config.snmp.trapinfo.17 = 文件系统由于严重情况而被禁用。EVT-OBJ::机柜=1 EVT-INFO::原因=系统时间向后跳转 config.snmp.trapinfo.19 = 无法在 2022 年 11 月 15 日星期二 06:00:00 启动计划的文件系统清理。
- 如果 FS 已关闭、无响应,或者当时发生了 HA 故障切换,或者 DD 正在重新启动或关闭,则可能还跳过了 GC
我们过去看到跳过 GC 的另一个原因(尽管很少见)是注册表中干净计划的不一致。例如,注册表和 CLI 都显示 GC 计划于当地时间星期日上午 06.00 运行:
# reg show collection.1.expunge.schedule
collection.1.expunge.schedule.days = Sun
collection.1.expunge.schedule.time = 0600
# filesys clean show config
Filesystem Cleaning Configuration
---------------------------------
50 Percent Throttle
Filesystem cleaning is scheduled to run "Sun" at "0600".
但是,“crontab”进程计划程序用于启动配置的作业的其他注册表项 (collection.1.crontab.expunge) 不正确,例如:
# reg show collection.1.crontab.expunge collection.1.crontab.expunge = 00 6 * * 2 root /ddr/bin/ddsh -s filesys clean start nowait scheduled
上面的注册表项指示计划的清理将在星期二当地时间 06.00 AM 启动(第五个“crontab”作业规范中的 2),而不是星期日 (0)。
Resolution
您可以随时清除警报,但这样做既无法解决底层问题,也不会导致立即启动清理。根据跳过 GC 周期的原因,该方法会有所不同,本知识库文章不会详细介绍该方法。请查看 DELL EMC DataDomain 知识库文章以获得帮助,如果没有,请联系您的签约支持提供商。
在“时间倒退跳转”的情况下 ,我们可以仔细检查reg配置是否与“filesys clean”计划匹配,然后重新启动cron服务:
*提醒:该命令需要 bash 模式控制台,以防打开新的 SR 以获得 Data Domain 支持的帮助。
执行此操作后,请确认指示计划在错误的日期进行清理的注册表项已更新:
在“时间倒退跳转”的情况下 ,我们可以仔细检查reg配置是否与“filesys clean”计划匹配,然后重新启动cron服务:
*提醒:该命令需要 bash 模式控制台,以防打开新的 SR 以获得 Data Domain 支持的帮助。
1 | double-check job configuration # filesys clean show schedule Filesystem cleaning is scheduled to run "Wed" at "1600". # reg show collection.1.crontab.expunge collection.1.crontab.expunge = 0 16 * * 3 root /ddr/bin/ddsh -s filesys clean start nowait scheduled 2 | set a new schedule if needed # filesys clean set schedule Wed 1600 3 | Restart the cron service [you can use one of them] # /etc/init.d/crond restart or # systemctl restart crond.service
仅对于注册表条目不一致的问题,修复方法是从 CLI 或 CLI 强制设置正确的清理计划。因此,继续该示例,管理员必须将清理计划设置为星期日上午 06.00 ,即使“filesys clean show schedule”已经报告是这种情况:
# filesys clean show schedule Filesystem cleaning is scheduled to run "Sun" at "0600". # filesys clean set schedule Sun 0600 Filesystem cleaning is scheduled to run "Sun" at "0600". # filesys clean show schedule Filesystem cleaning is scheduled to run "Sun" at "0600".
执行此操作后,请确认指示计划在错误的日期进行清理的注册表项已更新:
# reg show collection.1.crontab.expunge collection.1.crontab.expunge = 0 6 * * 0 root /ddr/bin/ddsh -s filesys clean start nowait scheduled
Affected Products
Data Domain, DD OS 6.0Article Properties
Article Number: 000052147
Article Type: Solution
Last Modified: 17 Jul 2023
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.