O PowerFlex SDS 14G desacopla ao criar o namespace do NVDIMM
Summary: O SDS é desacoplado ao criar o namespace do NVDIMM em um cluster em tempo real.
Symptoms
Cenário
Adicionar um novo NVDIMM e, em seguida, criar o namespace enquanto o SDS está ativo pode fazer com que o SDS se desacople.
Sintomas
- Criação de namespaces nos NVDIMMs com estes comandos:
ndctl create-namespace --force --reconfig=namespace4.0 --mode=devdax --align=4K --verbose --size=16G ndctl create-namespace --force --reconfig=namespace5.0 --mode=devdax --align=4K --verbose --size=16G
- O registro de eventos do MDM mostra a dissociação de SDSs.
2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.096 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc39; ID: 5473912c00000051 disconnected from the IP address 10.1.1.240 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 SDC_DISCONNECTED_FROM_SDS_IP WARNING SDC Name: sdc64; ID: 54736a1d0000000e disconnected from the IP address 10.1.0.239 of SDS sds107; ID: 80bc40f30000002e 2021-09-02 13:46:26.115 MULTIPLE_SDC_CONNECTIVITY_CHANGES INFO Multiple SDC connectivity changes occurred. 2021-09-02 13:46:29.134 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:30.293 MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2021-09-02 13:46:30.585 SDS_RECONNECTED INFO SDS: sds107 (ID 80bc40f30000002e) reconnected. 2021-09-02 13:46:40.140 SDS_DECOUPLED ERROR SDS: sds107 (id: 80bc40f30000002e) decoupled. 2021-09-02 13:46:42.391 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
- Os resultados do sar mostram que a CPU tinha intervalos de 5 segundos ao coletar dados:
01:46:24 PM 61 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:24 PM 62 3.73 0.00 1.49 0.00 0.00 0.75 0.75 0.00 0.00 93.28 01:46:24 PM 63 0.00 0.00 0.74 0.00 0.00 0.00 0.00 0.00 0.00 99.26 <==== 5 second gap 01:46:29 PM all 0.09 0.00 0.10 0.00 0.00 0.00 1.93 0.00 0.00 97.87 01:46:29 PM 0 0.23 0.00 0.00 0.00 0.00 0.00 0.23 0.00 0.00 99.54 01:46:29 PM 1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00 01:46:29 PM 2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 100.00
Impacto
Se SDSs suficientes se dissociarem porque estamos criando namespaces NVDIMM em vários SDSs, o cluster poderá entrar em um estado de falha de dados e alguns dados ficarão indisponíveis.
Cause
A criação de namespaces nos NVDIMMs e as pausas subsequentes da CPU e de outros recursos do SO estão diretamente relacionadas à forma como o sistema operacional interage com o driver e o barramento ao qual o NVDIMM está conectado. Isso pode causar breves períodos de parada do sistema operacional em relação aos outros nós do cluster, o que faz com que o SDS se desacople.
Resolution
É recomendável criar namespaces NVDIMM antes que os dados do cluster estejam ativos. Se não for possível ou se houver uma substituição de FRU, use o modo de manutenção. Isso permite que o sistema operacional no SDS crie os namespaces sem medo de dissociação.
Versões afetadas
PowerFlex v3.x e posterior
Correção feita na versão
Esse é um problema do sistema operacional e não será corrigido no PowerFlex.