PowerFlex: Disconnessioni frequenti di PowerFlex MDM

Summary: I componenti di PowerFlex come MDM si scollegano e si riconnettono rapidamente e frequentemente. Perdita di connessione seguita dalla connessione trovata negli eventi MDM. Connessione dopo 80-190 ms ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Sintomi

Registri degli eventi MDM che mostrano la frequente disconnessione e riconnessione del componente MDM:
 

2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING        The MDM,  (ID ), has lost connection to the cluster.
2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED     INFO             The MDM,  (ID ), connected after 100ms
2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING        The MDM,  (ID ), has lost connection to the cluster.
2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED     INFO             The MDM,  (ID ), connected after 110ms

L'output sar dal server MDM che si disconnette mostra ritrasmissioni TCP elevate:
 

sar -n ETCP 1 -t -f sar.0
                 atmptf/s  estres/s retrans/s  isegerr/s orsts/s
00:00:27 AM      0.00      0.00     62.00      0.00      0.00
00:00:28 AM      0.00      0.00     88.12      0.00      0.00
00:00:29 AM      0.00      3.00    100.00      0.00      0.00
00:00:30 AM      0.00      0.00     71.29      0.00      0.00
00:00:31 AM      0.00      0.00     71.00      0.00      0.00
...
00:01:02 AM      0.00      0.00     48.51      0.00      0.00
00:01:03 AM      0.00      0.00     15.00      0.00      0.00
00:01:04 AM      0.00      0.00    207.00      0.00      0.00
00:01:05 AM      0.00      0.00     36.00      0.00      0.00
00:01:06 AM      0.00      0.99    105.94      0.00      0.00

 

Impatto

Brevi eventi di riduzione del cluster MDM

Peggioramento delle prestazioni
 

Root cause:

Il server MDM è stato sottoposto a patch e il kernel Linux è stato aggiornato da 3.x a 5.x. Questo aggiornamento del kernel modifica molti dei parametri predefiniti del sistema operativo in valori diversi. In questo caso, il parametro TCP "net.ipv4.tcp_fack" è stato disabilitato, tra gli altri, ma questo sembra aver causato le ritrasmissioni TCP elevate.

L'RPM dell'SDS fornisce un file di configurazione denominato emc.conf nella directory /opt/emc/scaleio/sds/cfg/. Questo file include molti parametri del sistema operativo consigliati da Dell EMC.

 

Se si tratta di un ambiente di rack/appliance PowerFlex, PowerFlex Manager copia automaticamente il file emc.conf da "/opt/emc/scaleio/sds/cfg" su ciascuno dei file systcl.conf del server e lo applica. Ciò avverrà solo nel deployment iniziale del nodo. È possibile che sysctl.conf non sia stato aggiornato correttamente. Se il file sysctl.conf non esiste con i valori corretti, dopo un aggiornamento del kernel alla versione 5.x, è possibile che alcuni parametri importanti cambino.

Soluzione alternativa

In un ambiente rack/appliance PowerFlex, se sysctl.conf non include tutti i parametri di emc.conf, si consiglia di copiare emc.conf in ogni file /etc/sysctl.conf del server. Per applicare le modifiche sul server.  È possibile riavviare il server oppure eseguire il comando "sysctl -p" per applicare le modifiche da /etc/sysctl.conf. Accertarsi che vengano eseguite le procedure consigliate di manutenzione appropriate durante l'esecuzione di queste modifiche.

In un ambiente solo software, Dell EMC consiglia di applicare questi parametri Linux a ciascuno dei server, ma in ultima analisi spetta al business. Rivolgersi al fornitore del sistema operativo per le best practice o in caso di domande.
 

Versioni interessate

Tutte le versioni di PowerFlex

Affected Products

PowerFlex rack, PowerFlex Appliance, PowerFlex custom node, PowerFlex appliance connectivity, PowerFlex custom node, PowerFlex rack connectivity
Article Properties
Article Number: 000215824
Article Type: How To
Last Modified: 16 Oct 2023
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.