L SDS PowerFlex 14G si separa durante la creazione del namespace NVDIMM
Summary: Gli SDS si disaccoppiano durante la creazione del namespace NVDIMM su un cluster attivo.
Symptoms
Scenario
L'aggiunta di un nuovo NVDIMM e la successiva creazione del namespace mentre l SDS è attivo può causare il disaccoppiamento dell SDS.
Sintomi
- Creazione di namespace sui NVDIMM con questi comandi:
ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G
- Il registro eventi MDM mostra il disaccoppiamento degli SDS.
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO Multiple SDC connectivity changes occurred. 2021-09-02 13:46:29.134 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:30.293 MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2021-09-02 13:46:30.585 SDS_RECONNECTED INFO SDS: sds107 (ID 80bc40f30000002e) reconnected. 2021-09-02 13:46:40.140 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:42.391 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
- I risultati sar mostrano che la CPU ha avuto intervalli di 5 secondi durante la raccolta dei dati:
01:46:24 PM 61 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:24 PM 62 3.73 0.00 1.49 0.00 0.00 0.75 0.75 0.00 0.00 93.28 01:46:24 PM 63 0.00 0.00 0.74 0.00 0.00 0.00 0.00 0.00 0.00 99.26 <==== 5 second gap 01:46:29 PM all 0.09 0.00 0.10 0.00 0.00 0.00 1.93 0.00 0.00 97.87 01:46:29 PM 0 0.23 0.00 0.00 0.00 0.00 0.00 0.23 0.00 0.00 99.54 01:46:29 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:29 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
Impatto
Se un numero sufficiente di SDS si disaccoppia perché si stanno creando namespace NVDIMM su più SDS, il cluster può passare a uno stato di errore dei dati e alcuni dati non saranno disponibili.
Cause
La creazione di namespace sugli NVDIMM e le successive pause della CPU e di altre risorse del sistema operativo sono direttamente correlate al modo in cui il sistema operativo interagisce con il driver e il bus a cui è collegato il NVDIMM. Può causare brevi periodi di arresto del sistema operativo rispetto agli altri nodi del cluster, causando il disaccoppiamento dell SDS.
Resolution
Si consiglia di creare namespace NVDIMM prima che i dati del cluster siano attivi. Se non è possibile o se si sostituisce una FRU, utilizzare la modalità di manutenzione. Ciò consente al sistema operativo sull SDS di creare i namespace senza timore di separazione.
Versioni interessate
PowerFlex v3.x e versioni successive
Risolto nella versione
Si tratta di un problema del sistema operativo che non verrà risolto in PowerFlex.