PowerProtect DD:如果 DD 上設定了嚴重環境警示,則會停用檔案系統

Summary: 當系統發現環境狀況不佳,並在機櫃 1 上看到嚴重警示時,DD 檔案系統 (DDFS) 會自動停用自身作為保護措施

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

PowerProtect DDOS 包含保護措施,可在以下情況下停用 DD 檔案系統 (DDFS)

1:系統時間回溯超過 60 秒。如果系統時間發生此類變更,及/或 

2:如果有任何其他硬體元件故障,且系統為機櫃 1 設定了嚴重環境警示

將發生以下情況:   

  • DDFS 已停用,不會自動重新開機
  • 系統會發佈警示 (EVT-ENVIRONMENT-00052),即:    
Event posted: p0-32 -EVT-ENVIRONMENT-00052: File system is disabled due to a critical condition.EVT-OBJ::Enclosure=1 EVT-INFO::Cause=System Time backward jumped
Event posted: p0-32 -EVT-ENVIRONMENT-00052: File system is disabled due to a critical condition.EVT-OBJ::Enclosure=1 EVT-INFO::Cause=System has Critical alert

遇到此問題時:    

  • DDFS 無法手動重新開機 (開機時發生錯誤)
  • 還原日期和時間 (以反轉回溯跳躍) 不允許 DDFS 啟動
  • 解決硬體問題不允許 DDFS 啟動

Cause

在我們修復嚴重環境狀況之前,無法啟用 Data Domain 檔案系統,只是為了保護 DD 和其他整合至 DD 的應用程式

實作此保護措施是為了回溯跳躍系統時間,這可能會對某些儲存 DDR 資料的備份應用程式產生不良影響。因此,DDR 系統管理員必須先允許系統時間變更,才能重新啟用 DDFS。

注意:一旦遇到此問題,DDFS 就無法啟用,因為它會拒絕啟動,例如:    

# filesys enable
Please wait...
01/01 20:32:10.217 (tid 0xxxxxxx): INFO: Event posted: m0-28 (2100001c:553648156): EVT-FILESYS-00008: Filesystem has encountered an error and is restarting.
**** There was a problem bringing up the filesystem. Status: The filesystem is aborting due to a problem.

此外,反轉系統時間的回溯跳躍不允許重新啟用 DDFS (問題仍然存在)。

Resolution

若要啟用 DDFS,請遵循這些步驟。如果受影響的 DD 是 DD HA 配對中的使用中節點,請在啟用檔案系統 (FS) 之前,將這些步驟套用至兩個節點。

從 UI:

1.請確定系統的日期和時間正確無誤。如果您變更時區,DDR 可能會提示您重新開機。
    請立即執行此重新開機,以確保所有程序辨識新時區。前往 系統管理>設定 >時間和日期

檢查系統日期與時間 

 

  • 如果您已啟用 NTP,請暫時停用它以修正時鐘。前往 更多工作>設定時間設定

停用 NTP

  • 然後再次設定時間設定,以視需要重新啟用 NTP

 

2.清除對應於「檔案系統已因嚴重狀況而停用」錯誤的緊急警示。前往執行狀況 > 警示 > 目前警示

清除檔案系統警示

  • 等待一分鐘,讓警示清除並更新系統狀態。如果不這麼做,系統狀態在 DDFS 程序開始前可能不會完全更新,可能會導致一次性 FS 當機和警示。

 

3.如果在清除警示後尚未啟用檔案系統,請將其啟用。前往資料管理 > 檔案系統 > 摘要 > 按一下頁面底部的啟用。

啟用 FS

  • DDFS 現在應可正常開機/執行。如果您在清除警示後未能在開始 FS 程序前等待足夠時間,您可能會在 CLI 上收到關於 FS 遇到問題的警示,但是 FS 會繼續嘗試啟動,如果問題如本 KB 中所述,則 FS 程序最終會啟用。

 

從 CLI:

1a.請確定系統的日期和時間正確無誤。如果您變更時區,DDR 可能會提示您重新開機。
    請立即執行此重新開機,以確保所有程序辨識新時區。

1二.確認 DD 中的所有硬體元件均處於良好狀態

2.清除與「檔案系統因為嚴重狀況已停用」錯誤相對應的緊急警示:    

# alert clear alert-id [alert id]

     例如,如果這是警示 p0-32 (如上所示):    
 

# alert clear alert-id p0-32

3.等待一分鐘,讓警示清除並更新系統狀態。如果不這樣做,系統狀態可能不會在 FS 進程啟動之前完全更新,這可能會導致一次性 FS 崩潰和警報。

4.現在 DDFS 應該會自動上線,您可以使用「# filesys status」檢查檔案系統的狀態。如果沒有,請啟用 DDFS:    

# filesys enable
  • DDFS 現在應可正常開機/執行。如果您在清除警示後未能在開始 FS 程序前等待足夠時間,您可能會在 CLI 上收到關於 FS 遇到問題的警示,但是 FS 會繼續嘗試啟動,如果問題如本 KB 中所述,則 FS 程序最終會啟用。

 

如需有關此保護措施或本文內任何資訊的進一步資訊,請聯絡 Dell 技術支援部門

Additional Information

此問題的範例如下所示:    

  • 一開始,DDFS 運作正常:    
# filesys status
The filesystem is enabled and running.

 

  • DDR 的系統日期,時間為 2017 年 3 月 7 日 13:28:    
# date
Sun Mar  7 13:28:24 PST 2017

 

  • 此日期會手動設定回 2017 年 1 月 1 日 (必須先停用網路時間通訊協定/NTP 才能進行此變更):    
# system set date 01012017

 

  • 登入 DDR (messages.engineering) 表示系統日期或時間已回溯變更,且 DDFS 正在停用:
Mar  7 13:28:24 rtp-ddr30 ddsh: NOTICE: MSG-DDSH-00009: (tty=ttyS0, session=15703) root: command "system set date 01012017"
...
Jan  1 20:17:04 rtp-ddr30 ddr_stated: Availability stats: Invalid time interval -5591476. Probably the system clock was changed.
Jan  1 20:17:51 rtp-ddr30 platmon: INFO: Found a system time jump: -5591485
Jan  1 20:17:51 rtp-ddr30 platmon: INFO: Before Jump: system time: Tue Mar  7 13:28:15 2017 , rtc time: Tue Mar  7 13:28:16 2017 , ntp last sync time: Unknown
Jan  1 20:17:51 rtp-ddr30 platmon: INFO: After  Jump: system time: Sun Jan  1 20:17:51 2017 , rtc time: Sun Jan  1 20:17:51 2017 , ntp last sync time: Unknown
...
Jan  1 20:17:51 rtp-ddr30 platmon: NOTICE: post_alert: Generating alert EVT-ENVIRONMENT-00052
Jan  1 20:17:52 rtp-ddr30 platmon: INFO: Event posted: p0-32 (11000020:285212704): EVT-ENVIRONMENT-00052: File system is disabled due to a critical condition.EVT-OBJ::Enclosure=1 EVT-INFO::Cause=System Time backward jumped
Jan  1 20:17:52 rtp-ddr30 platmon: NOTICE: evaluate_symbol_node: taking action(s) on error_indict(1)
Jan  1 20:17:52 rtp-ddr30 platmon: INFO: System time jumped, needs service now
Jan  1 20:17:52 rtp-ddr30 platmon: ERROR: Fatal error in platform monitor, DDFS shall be disabled
...
Jan  1 20:17:55 rtp-ddr30 ddr_procmon: ERROR: Critical error is detected by platform monitoring, filesystem is shutdown.
...
Jan  1 20:17:55 rtp-ddr30 ddr_stated: INFO: change_state(): shutdown requested
Jan  1 20:17:55 rtp-ddr30 ddfs[3761]: NOTICE: MSG-DDR-00003: Shutting down ddfs

 

  • 隨即會發佈緊急警示,指出「由於嚴重狀況」,DDFS 已停用:    

警示螢幕擷取畫面顯示目前的命令,顯示由於嚴重狀況,DDFS 已停用

當 DD 屬於 Windows Active Directory 或加入其中時,它會使用網域控制站 (DC) 作為其系統時間來源。DD 會定期將其日期和時間與 DC 同步。如果 Windows DC 的日期和時間變更,會透過 CIFS 將更新推送至 DD。向後時間跳躍超過 60 秒會觸發此行為。

若要瞭解是否是這種情況,請先檢查 DD 是否已針對 CIFS 設定,並已綁定或加入特定 Active Directory 領域:   

# cifs show config
Mode                 Active-Directory
Realm                realm.example.com
Domain Controllers   *
WINS Server          not specified
NB Hostname          DD9300
Max Connections      Not Available
Max Open Files       Not Available

 

  • 如果是的話,請檢查「cifs.log」檔案中是否有如同以下所示的項目:   
# log view debug/cifs/cifs.log
Mar 28 22:03:16 DD9300 lsass: ALWAYS: [24497/1585429396.001947087] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Sat Mar 28 22:03:16 2020 ] to [Sat Mar 28 22:54:38 2020 ]
Mar 28 23:44:38 DD9300 lsass: ALWAYS: [24497/1585435478.001799190] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Sat Mar 28 23:44:38 2020 ] to [Sat Mar 28 22:53:15 2020 ]
Mar 29 22:04:38 DD9300 lsass: ALWAYS: [24497/1585512278.002014016] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Sun Mar 29 22:04:38 2020 ] to [Sun Mar 29 22:55:53 2020 ]
Mar 29 23:25:53 DD9300 lsass: ALWAYS: [24499/1585517153.001946740] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Sun Mar 29 23:25:53 2020 ] to [Sun Mar 29 22:34:37 2020 ]
Mar 29 23:25:53 DD9300 lsass: ALWAYS: [24497/1585517153.001946645] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Sun Mar 29 23:25:53 2020 ] to [Sun Mar 29 22:34:37 2020 ]
Mar 30 22:00:53 DD9300 lsass: ALWAYS: [24497/1585598453.002161373] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Mon Mar 30 22:00:53 2020 ] to [Mon Mar 30 22:52:01 2020 ]
Mar 30 23:12:01 DD9300 lsass: ALWAYS: [24497/1585602721.002275775] [lsass] ADSyncTimeToDC: Attempting to change System Time, from [Mon Mar 30 23:12:01 2020 ] to [Mon Mar 30 22:20:52 2020 ]

 

設定的 DC 發生問題,因為時間每天向前跳 50 分鐘,然後很快又回復回來。這種情況每天大約在同一時間發生。這會觸發 DD 警示,並強制 DD FS 關機。在此特定情況下,必須調查DC的時間更改並相應地解決。

設定 Active Directory 時,建議您根據 DDOS 8.0 管理指南 的內容停用 NTP (請參閱第 137 頁):    

 

注意:
如果 NTP 和網域控制站都在修改時間,從 Active Directory 網域控制站使用時間同步可能會導致系統上發生過多的時間變更。
至少,如果使用 AD 和 NTP 時間同步,如果啟用了 NTP,則應將其配置為同步到 DC 提供的 NTP 伺服器或已設定 DC 的上游時間源以保持一致。

Affected Products

Data Domain

Products

Data Domain, Data Domain Boost – File System, Data Domain Deduplication Storage Systems, DD OS 6.2, DD OS, DD OS 6.0, DD OS 6.1, DD OS 7.0, DD OS 7.1, DD6300 Appliance, DD6800 Appliance, DD9300 Appliance
Article Properties
Article Number: 000060531
Article Type: Solution
Last Modified: 10 Jul 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.