PowerFlex 14G SDS entkoppelt sich bei der Erstellung eines NVDIMM-Namespace

Summary: SDS entkoppelt bei der Erstellung eines NVDIMM-Namespace auf einem Live-Cluster.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Szenario
Das Hinzufügen eines neuen NVDIMM und das anschließende Erstellen des Namespace, während der SDS aktiv ist, kann dazu führen, dass sich der SDS entkoppelt.

Symptome
 - Erstellen von Namespaces auf den NVDIMMs mit den folgenden Befehlen:

ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G
ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G

- Das MDM-Ereignisprotokoll zeigt die SDS-Entkopplung.

 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING  	 SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 
2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO     	 Multiple SDC connectivity changes occurred. 
2021-09-02 13:46:29.134 SDS_DECOUPLED             ERROR    	 SDS: sds107 (id: 80bc40f30000002e) decoupled. 
2021-09-02 13:46:30.293 MDM_DATA_FAILED           CRITICAL 	 The system is now in DATA FAILURE state. Some data is unavailable. 
2021-09-02 13:46:30.585 SDS_RECONNECTED           INFO     	 SDS: sds107 (ID 80bc40f30000002e) reconnected. 
2021-09-02 13:46:40.140 SDS_DECOUPLED             ERROR    	 SDS: sds107 (id: 80bc40f30000002e) decoupled. 
2021-09-02 13:46:42.391 MDM_DATA_DEGRADED         ERROR    	 The system is now in DEGRADED state. 

- Die sar-Ergebnisse zeigen, dass die CPU beim Sammeln von Daten eine Lücke von 5 Sekunden hatte:

 01:46:24 PM      61      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00
01:46:24 PM      62      3.73      0.00      1.49      0.00      0.00      0.75      0.75      0.00      0.00     93.28
01:46:24 PM      63      0.00      0.00      0.74      0.00      0.00      0.00      0.00      0.00      0.00     99.26   <==== 5 second gap
01:46:29 PM     all      0.09      0.00      0.10      0.00      0.00      0.00      1.93      0.00      0.00     97.87
01:46:29 PM       0      0.23      0.00      0.00      0.00      0.00      0.00      0.23      0.00      0.00     99.54
01:46:29 PM       1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00
01:46:29 PM       2      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00    100.00

 

Auswirkungen

Wenn sich genügend SDSs entkoppeln, weil wir NVDIMM-Namespaces auf mehreren SDSs erstellen, kann der Cluster in den Status "Data Failure" wechseln und einige Daten sind nicht verfügbar.

Cause

Das Erstellen von Namespaces auf den NVDIMMs und das anschließende Anhalten von CPU- und anderen Betriebssystemressourcen hängt direkt damit zusammen, wie das Betriebssystem mit dem Treiber und dem Bus interagiert, mit dem das NVDIMM verbunden ist. Dies kann dazu führen, dass das Betriebssystem in Bezug auf die anderen Nodes im Cluster kurzzeitig angehalten wird, was zu einer Entkopplung des SDS führt. 

 

Resolution

Es wird empfohlen, NVDIMM-Namespaces zu erstellen, bevor Clusterdaten live sind. Wenn dies nicht möglich ist oder wenn eine FRU ausgetauscht werden muss, verwenden Sie den Wartungsmodus. Dadurch kann das Betriebssystem auf dem SDS die Namespaces erstellen, ohne Angst vor einer Entkopplung zu haben. 

Betroffene Versionen

PowerFlex v3.x und höher

Behoben in Version

Dies ist ein Betriebssystemproblem, das in PowerFlex nicht behoben werden kann.

Affected Products

PowerFlex Software

Products

VxFlex Product Family, VxFlex Ready Node, Ready Node Series
Article Properties
Article Number: 000193825
Article Type: Solution
Last Modified: 14 Apr 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.