PowerFlex 14G SDS ontkoppelt bij het maken van NVDIMM-namespace
Summary: SDS ontkoppelt bij het maken van NVDIMM-naamruimte op een live cluster.
Symptoms
Scenario
Het toevoegen van een nieuwe NVDIMM en vervolgens het maken van de namespace terwijl de SDS live is, kan ertoe leiden dat de SDS wordt ontkoppeld.
Symptomen
- Naamruimten aanmaken op de NVDIMM's met de volgende opdrachten:
ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G
- In het MDM-gebeurtenissenlogboek wordt de ontkoppeling van SDS's weergegeven.
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO Multiple SDC connectivity changes occurred. 2021-09-02 13:46:29.134 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:30.293 MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2021-09-02 13:46:30.585 SDS_RECONNECTED INFO SDS: sds107 (ID 80bc40f30000002e) reconnected. 2021-09-02 13:46:40.140 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:42.391 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
- De sar-resultaten laten zien dat de CPU gaten van 5 seconden had bij het verzamelen van gegevens:
01:46:24 PM 61 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:24 PM 62 3.73 0.00 1.49 0.00 0.00 0.75 0.75 0.00 0.00 93.28 01:46:24 PM 63 0.00 0.00 0.74 0.00 0.00 0.00 0.00 0.00 0.00 99.26 <==== 5 second gap 01:46:29 PM all 0.09 0.00 0.10 0.00 0.00 0.00 1.93 0.00 0.00 97.87 01:46:29 PM 0 0.23 0.00 0.00 0.00 0.00 0.00 0.23 0.00 0.00 99.54 01:46:29 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:29 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
Impact
Als voldoende SDS-exemplaren worden ontkoppeld omdat we NVDIMM-naamruimtes op meerdere SDS'en maken, kan het cluster de status Datafout krijgen en zijn sommige data niet beschikbaar.
Cause
Het maken van naamruimten op de NVDIMM's en de daaropvolgende onderbrekingen van CPU en andere bronnen van het besturingssysteem is rechtstreeks gerelateerd aan de interactie tussen het besturingssysteem en de driver en de bus waarop de NVDIMM is aangesloten. Dit kan ertoe leiden dat het besturingssysteem korte tijd stopt ten opzichte van de andere knooppunten in het cluster, waardoor de SDS wordt ontkoppeld.
Resolution
Het wordt aanbevolen om NVDIMM-namespaces te maken voordat clusterdata live zijn. Als dit niet mogelijk is of als een FRU moet worden vervangen, gebruik dan de onderhoudsmodus. Hierdoor kan het besturingssysteem op de SDS de namespaces maken zonder bang te hoeven zijn voor ontkoppeling.
Versies waarop dit van toepassing is
PowerFlex v3.x en verder
Opgelost in versie
Dit is een probleem met het besturingssysteem en wordt niet opgelost in PowerFlex.