PowerFlex 14G SDS entkoppelt sich bei der Erstellung eines NVDIMM-Namespace
Summary: SDS entkoppelt bei der Erstellung eines NVDIMM-Namespace auf einem Live-Cluster.
Symptoms
Szenario
Das Hinzufügen eines neuen NVDIMM und das anschließende Erstellen des Namespace, während der SDS aktiv ist, kann dazu führen, dass sich der SDS entkoppelt.
Symptome
- Erstellen von Namespaces auf den NVDIMMs mit den folgenden Befehlen:
ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G
- Das MDM-Ereignisprotokoll zeigt die SDS-Entkopplung.
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO Multiple SDC connectivity changes occurred. 2021-09-02 13:46:29.134 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:30.293 MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2021-09-02 13:46:30.585 SDS_RECONNECTED INFO SDS: sds107 (ID 80bc40f30000002e) reconnected. 2021-09-02 13:46:40.140 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:42.391 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
- Die sar-Ergebnisse zeigen, dass die CPU beim Sammeln von Daten eine Lücke von 5 Sekunden hatte:
01:46:24 PM 61 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:24 PM 62 3.73 0.00 1.49 0.00 0.00 0.75 0.75 0.00 0.00 93.28 01:46:24 PM 63 0.00 0.00 0.74 0.00 0.00 0.00 0.00 0.00 0.00 99.26 <==== 5 second gap 01:46:29 PM all 0.09 0.00 0.10 0.00 0.00 0.00 1.93 0.00 0.00 97.87 01:46:29 PM 0 0.23 0.00 0.00 0.00 0.00 0.00 0.23 0.00 0.00 99.54 01:46:29 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:29 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
Auswirkungen
Wenn sich genügend SDSs entkoppeln, weil wir NVDIMM-Namespaces auf mehreren SDSs erstellen, kann der Cluster in den Status "Data Failure" wechseln und einige Daten sind nicht verfügbar.
Cause
Das Erstellen von Namespaces auf den NVDIMMs und das anschließende Anhalten von CPU- und anderen Betriebssystemressourcen hängt direkt damit zusammen, wie das Betriebssystem mit dem Treiber und dem Bus interagiert, mit dem das NVDIMM verbunden ist. Dies kann dazu führen, dass das Betriebssystem in Bezug auf die anderen Nodes im Cluster kurzzeitig angehalten wird, was zu einer Entkopplung des SDS führt.
Resolution
Es wird empfohlen, NVDIMM-Namespaces zu erstellen, bevor Clusterdaten live sind. Wenn dies nicht möglich ist oder wenn eine FRU ausgetauscht werden muss, verwenden Sie den Wartungsmodus. Dadurch kann das Betriebssystem auf dem SDS die Namespaces erstellen, ohne Angst vor einer Entkopplung zu haben.
Betroffene Versionen
PowerFlex v3.x und höher
Behoben in Version
Dies ist ein Betriebssystemproblem, das in PowerFlex nicht behoben werden kann.