PowerFlex 14G SDS oddziela się podczas tworzenia przestrzeni nazw NVDIMM
Summary: SDS oddziela się podczas tworzenia przestrzeni nazw NVDIMM w aktywnym klastrze.
Symptoms
Scenariusz
Dodanie nowego modułu NVDIMM, a następnie utworzenie przestrzeni nazw, gdy serwer SDS jest aktywny, może spowodować rozdzielenie karty SDS.
Objawy
- Tworzenie przestrzeni nazw w modułach NVDIMM za pomocą następujących poleceń:
ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G
- Dziennik zdarzeń MDM pokazuje odłączenie SDS.
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO Multiple SDC connectivity changes occurred. 2021-09-02 13:46:29.134 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:30.293 MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2021-09-02 13:46:30.585 SDS_RECONNECTED INFO SDS: sds107 (ID 80bc40f30000002e) reconnected. 2021-09-02 13:46:40.140 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:42.391 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
- Wyniki sar pokazują, że procesor miał 5-sekundowe przerwy podczas zbierania danych:
01:46:24 PM 61 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:24 PM 62 3.73 0.00 1.49 0.00 0.00 0.75 0.75 0.00 0.00 93.28 01:46:24 PM 63 0.00 0.00 0.74 0.00 0.00 0.00 0.00 0.00 0.00 99.26 <==== 5 second gap 01:46:29 PM all 0.09 0.00 0.10 0.00 0.00 0.00 1.93 0.00 0.00 97.87 01:46:29 PM 0 0.23 0.00 0.00 0.00 0.00 0.00 0.23 0.00 0.00 99.54 01:46:29 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:29 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
Wpływ
Jeśli wystarczająca liczba serwerów SDS zostanie oddzielona z powodu tworzenia przestrzeni nazw NVDIMM na wielu serwerach SDS, klaster może przejść w stan awarii danych, w wyniku czego niektóre dane będą niedostępne.
Cause
Tworzenie przestrzeni nazw w modułach NVDIMM oraz późniejsze wstrzymanie działania procesora i innych zasobów systemu operacyjnego jest bezpośrednio związane ze sposobem interakcji systemu operacyjnego ze sterownikiem i magistralą, do której podłączony jest moduł NVDIMM. Może to powodować krótkie okresy zatrzymywania systemu operacyjnego względem innych węzłów w klastrze, co powoduje odłączenie SDS.
Resolution
Zaleca się utworzenie przestrzeni nazw NVDIMM, zanim dane klastra staną się aktywne. Jeśli nie jest to możliwe lub jeśli wymiana elementu FRU jest niemożliwa, użyj trybu konserwacji. Dzięki temu system operacyjny na serwerze SDS może tworzyć przestrzenie nazw bez obawy o rozłączenie.
Wersje, których dotyczy problem
PowerFlex 3.x i nowsze wersje
Naprawiono w wersji
Jest to problem z systemem operacyjnym, który nie zostanie rozwiązany w systemie PowerFlex.