PowerFlex: Disconnessioni frequenti dell MDM
Summary: I componenti PowerFlex, come l MDM, si disconnettono e si riconnettono rapidamente e frequentemente. Connessione persa seguita da connessione trovata negli eventi MDM Connessione dopo 80-190 ms ...
Instructions
Sintomi
Registri eventi MDM che mostrano le frequenti disconnessioni e riconnessioni del componente MDM:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
L'output SAR dal server MDM che si sta disconnettendo mostra un numero elevato di ritrasmissioni TCP:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Impatto
Breve evento danneggiato del cluster MDM
Riduzione delle prestazioni
Root cause:
Il server MDM è stato sottoposto a patch e il kernel Linux è stato aggiornato dalla versione 3.x alla 5.x. Questo aggiornamento del kernel modifica molti dei parametri predefiniti del sistema operativo in valori diversi. In questo caso, il parametro TCP "net.ipv4tcp_fack" è stato disabilitato, tra gli altri, ma questo sembrava aver causato l'elevato numero di ritrasmissioni TCP.
L RPM SDS fornisce un file di configurazione denominato emc.conf nella directory /opt/emc/scaleio/sds/cfg/. Questo file include molti parametri del sistema operativo consigliati da Dell.
Se si tratta di un'ambiente PowerFlex Rack/Appliance, PowerFlex Manager copierà automaticamente il file emc.conf da "/opt/emc/scaleio/sds/cfg" in ciascuno dei systcl.conf del server e lo applicherà. Questa operazione si verificherà solo nel deployment iniziale del nodo. È possibile che sysctl.conf non sia stato aggiornato correttamente. Se il file sysctl.conf non esiste con i valori corretti, dopo un aggiornamento del kernel alla versione 5.x, è possibile che alcuni parametri importanti vengano modificati.
Soluzione alternativa
In un'ambiente PowerFlex Rack/Appliance, se sysctl.conf non include tutti i parametri di emc.conf, si consiglia di copiare emc.conf in ogni file /etc/sysctl.conf del server. Per applicare le modifiche sul server. È possibile riavviare il server oppure eseguire il comando "sysctl -p" per applicare le modifiche da /etc/sysctl.conf. Quando si apportano queste modifiche, assicurarsi che vengano eseguite le procedure consigliate per la manutenzione corretta.
In un ambiente solo software, Dell Technologies consiglia di applicare questi parametri Linux a ciascuno dei server, ma in ultima analisi è compito dell'azienda. Consultare il fornitore del sistema operativo per le best practice o in caso di domande.
Versioni interessate
Tutte le versioni di PowerFlex