建立 NVDIMM 命名空間時,PowerFlex 14G SDS 會分離

Summary: SDS 在即時叢集上建立 NVDIMM 命名空間時會分離。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

劇本
新增 NVDIMM,然後在 SDS 上線時建立命名空間,可能會導致 SDS 分離。

症狀
- 使用這些命令在 NVDIMM 上建立命名空間:

ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G
ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G

MDM 事件記錄顯示 SDS 分離。

 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO     	 Multiple SDC connectivity changes occurred. 
2021-09-02 13:46:29.134 SDS_DECOUPLED             ERROR    	 SDS: sds107 (id: 80bc40f30000002e) decoupled. 
2021-09-02 13:46:30.293 MDM_DATA_FAILED           CRITICAL 	 The system is now in DATA FAILURE state. Some data is unavailable. 
2021-09-02 13:46:30.585 SDS_RECONNECTED           INFO     	 SDS: sds107 (ID 80bc40f30000002e) reconnected. 
2021-09-02 13:46:40.140 SDS_DECOUPLED             ERROR    	 SDS: sds107 (id: 80bc40f30000002e) decoupled. 
2021-09-02 13:46:42.391 MDM_DATA_DEGRADED         ERROR    	 The system is now in DEGRADED state. 

- sar 結果顯示 CPU 在收集數據時有 5 秒的間隙:

 01:46:24 PM      61      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00
01:46:24 PM      62      3.73      0.00      1.49      0.00      0.00      0.75      0.75      0.00      0.00     93.28
01:46:24 PM      63      0.00      0.00      0.74      0.00      0.00      0.00      0.00      0.00      0.00     99.26   <==== 5 second gap
01:46:29 PM     all      0.09      0.00      0.10      0.00      0.00      0.00      1.93      0.00      0.00     97.87
01:46:29 PM       0      0.23      0.00      0.00      0.00      0.00      0.00      0.23      0.00      0.00     99.54
01:46:29 PM       1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00
01:46:29 PM       2      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00

 

影響

如果我們在多個軟體定義儲存 (SDS) 上建立 NVDIMM 命名空間,而導致有足夠多的軟體定義儲存 (SDS) 解耦,叢集可能會進入資料故障狀態,且部分資料將無法使用。

Cause

在 NVDIMM 上建立命名空間以及隨後暫停 CPU 和其他作業系統資源,與作業系統與驅動程式和 NVDIMM 所連接的匯流排互動的方式直接相關。這可能會導致作業系統相對於叢集中的其他節點短暫停止,導致 SDS 分離。 

 

Resolution

建議您在叢集資料上線之前建立 NVDIMM 命名空間。如果無法進行,或是要更換 FRU,請使用維護模式。這使 SDS 上的作業系統能夠創建命名空間,而不必擔心分離。 

受影響的版本

PowerFlex v3.x 及更新版本

已修正問題的版本

這是作業系統問題,不會在 PowerFlex 中修正。

Affected Products

PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node, Ready Node Series
Article Properties
Article Number: 000193825
Article Type: Solution
Last Modified: 14 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.