Data Domain:排程的清理無法開始,張貼警告「EVT-GC-00002:無法啟動排程的檔案系統清理」
Summary: DataDomain 清理 (GC) 排定在特定日期和時間執行。在較新的 DDOS 版本中,當有任何此類排程,且基於任何原因無法啟動清理程序時,系統監控精靈會注意到此問題,並會發出警示。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
DataDomain 清理 (垃圾收集,GC) 排定在特定日期和時間執行。在 DDOS 6.0.x 及更新版本中,當有任何此類排程,且基於任何原因而無法啟動清理程序時,系統監控精靈會注意到此問題,並最終發出如下所示的警示:
# alerts show current # alerts show current Id Post Time Severity Class Object Message ----- ------------------------ -------- ----------- --------- ----------------------------------------------------------------------------------------- m0-11 Tue Jun 27 16:32:03 2017 WARNING Filesystem EVT-GC-00002: Unable to start scheduled file system cleaning on Tue Jun 27 16:04:00 2017. ----- ------------------------ -------- ----------- --------- -----------------------------------------------------------------------------------------
此外,還會傳送包含如下詳細資料的警示 ASUP:
Hostname: dd-6800 Location: Lab4_Row_M System SerialNo: APMxxxxxxxxxxxxxx Chassis SerialNo: FCxxxxxxxxxxxxxxx ModelNo: DD6800 Version: 6.0.0.1 Time: Tue Jun 27 16:15:02 2017 Alert Id: m0-11 Event Id: EVT-GC-00002 Event Message: Unable to start scheduled file system cleaning on Tue Jun 27 16:04:00 2017. Event Description: Cleaning has not started as scheduled. Space for deleted files will not be reclaimed until cleaning completes. This may impact the ability to backup. Recommended Action: Determine the reason why cleaning did not start. Manually start cleaning if free space needs to be reclaimed before the next scheduled cleaning. If problem persists, contact your contracted support provider or visit us online at https://support.emc.com.
Cause
此警示只會通知已排定的清理程序無法在應啟動的時間啟動。造成這種情況的多種可能原因,其中大多數並不表示有任何問題。可能觸發警報的原因包括:
我們過去看到跳過 GC 的另一個原因(儘管很少見)是註冊表中的乾淨計劃有些不一致。例如,登錄檔和 CLI 都顯示 GC 排定在週日上午 06:00 執行(當地時間):
但是,「crontab」程序排程器用來啟動已設定工作的不同登錄機碼 (collection.1.crontab.expunge) 是不正確的,例如:
- 排程的清理程序必須開始時,DD GC 已在執行。由於在任何給定時間只能運行一個 GC 進程,並且嘗試一個進程不會搶佔正在運行的 GC,因此會跳過計劃的進程,因此出現警報
- 與 GC 不相容的動作,例如,執行從使用中儲存層往歸檔儲存層的資料移動 (FMIG),或在使用層 GC 即將開始執行雲端層清理
- 先前在系統時區的變更可能導致負責排程工作的內部「cron」守護程式仍在舊時區執行,而不是新時區,因此根據先前和目前的時區,DD GC 可能會比預期早或晚幾個小時執行,因此會針對已跳過的 GC 發出警示。您可以檢查 KB Data Domain:如何修改 Data Domain Restorer (DDR) 上的日期/時間和/或時區 ,以取得有關 DD 時區變更的更多詳細資訊
- 在內部,將工作提交至內部「sms」精靈以執行「filesys clean start」命令,以開始 DD 清理。如果「sms」沒有回應,或 FS 無法準時回應「sms」,GC 將無法啟動,並且會略過。您可能需要檢查「sms.info」記錄中是否有符合的項目 例如這些項目 這代表已嘗試清理 但工作無法啟動
02/28 12:00:26.495 (TID 0xa79c040):已完成作業:操作3278752:sms_filesys_clean_start,持續時間:25067 msec,狀態:檔案系統無回應。
- 與上述相同,但由於「時間向後跳躍」cron的服務未與新時間集
同步,我們可以在ASUP上找到如下所示的內容:
config.snmp.trapinfo.17 = 檔案系統由於嚴重狀況而停用。EVT-OBJ::Enclosure=1 EVT-INFO::Cause=System Time backward leap config.snmp.trapinfo.19 = 無法在 Tue Nov 15 06:00:00 2022 開始排程的檔案系統清理。
- 如果 FS 已關閉、無回應,或當時正在進行 HA 容錯移轉,或是 DD 正在重新開機或關閉,則可能也會跳過 GC
我們過去看到跳過 GC 的另一個原因(儘管很少見)是註冊表中的乾淨計劃有些不一致。例如,登錄檔和 CLI 都顯示 GC 排定在週日上午 06:00 執行(當地時間):
# reg show collection.1.expunge.schedule
collection.1.expunge.schedule.days = Sun
collection.1.expunge.schedule.time = 0600
# filesys clean show config
Filesystem Cleaning Configuration
---------------------------------
50 Percent Throttle
Filesystem cleaning is scheduled to run "Sun" at "0600".
但是,「crontab」程序排程器用來啟動已設定工作的不同登錄機碼 (collection.1.crontab.expunge) 是不正確的,例如:
# reg show collection.1.crontab.expunge collection.1.crontab.expunge = 00 6 * * 2 root /ddr/bin/ddsh -s filesys clean start nowait scheduled
上述登錄機碼指出排定的清理將在星期二當地時間上午 06:00 開始 (第五個「crontab」工作規格為 2),而非週日 (0)。
Resolution
您可以隨時清除警示,但這樣做無法解決根本問題,也不會立即啟動清理作業。視略過 GC 週期的原因而定,方法會有所不同,本 KB 不會進一步詳細說明。請查看 DELL EMC DataDomain KB 文章以取得協助,如果沒有,請聯絡您的簽約支援供應商。
在「時間回溯跳轉」的情況下 ,我們可以仔細檢查註冊配置是否與「filesys clean」計劃匹配,然後重新啟動cron服務:
*注意:命令需要 bash 模式主控台,以防開啟新的 SR 以取得 Data Domain Support 的協助。
執行此操作后,確認指示清理安排在錯誤日期的註冊表項已更新:
在「時間回溯跳轉」的情況下 ,我們可以仔細檢查註冊配置是否與「filesys clean」計劃匹配,然後重新啟動cron服務:
*注意:命令需要 bash 模式主控台,以防開啟新的 SR 以取得 Data Domain Support 的協助。
1 | double-check job configuration # filesys clean show schedule Filesystem cleaning is scheduled to run "Wed" at "1600". # reg show collection.1.crontab.expunge collection.1.crontab.expunge = 0 16 * * 3 root /ddr/bin/ddsh -s filesys clean start nowait scheduled 2 | set a new schedule if needed # filesys clean set schedule Wed 1600 3 | Restart the cron service [you can use one of them] # /etc/init.d/crond restart or # systemctl restart crond.service
僅針對註冊表項不一致的問題,解決方法是從 CLI 或 CLI 強制設置正確的清理計劃。因此,繼續該示例,即使「filesys clean show schedule」已經報告這種情況,管理員也必須將清理計劃設置為星期日上午 06:00:
# filesys clean show schedule Filesystem cleaning is scheduled to run "Sun" at "0600". # filesys clean set schedule Sun 0600 Filesystem cleaning is scheduled to run "Sun" at "0600". # filesys clean show schedule Filesystem cleaning is scheduled to run "Sun" at "0600".
執行此操作后,確認指示清理安排在錯誤日期的註冊表項已更新:
# reg show collection.1.crontab.expunge collection.1.crontab.expunge = 0 6 * * 0 root /ddr/bin/ddsh -s filesys clean start nowait scheduled
Affected Products
Data Domain, DD OS 6.0Article Properties
Article Number: 000052147
Article Type: Solution
Last Modified: 17 Jul 2023
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.