PowerFlex : Déconnexions MDM fréquentes
Résumé: Les composants PowerFlex tels que le MDM se déconnectent et se reconnectent rapidement et fréquemment. Connexion perdue suivie d’une connexion détectée dans les événements MDM Connexion après 80 à 190 ms ...
Instructions
Symptômes
Journaux d’événements MDM indiquant les déconnexions et reconnexions fréquentes du composant MDM :
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
La sortie SAR du serveur MDM qui se déconnecte affiche des retransmissions TCP élevées :
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Impact
Événements dégradés de cluster MDM succincts
Dégradation des performances
Cause
Le serveur MDM a été corrigé et le noyau Linux a été mis à niveau de la version 3.x vers la version 5.x. Cette mise à niveau du noyau modifie la plupart des paramètres par défaut du système d’exploitation en leur attribuant des valeurs. Dans ce cas, le paramètre TCP « net.ipv4tcp_fack » a été désactivé, entre autres, mais celui-ci semble avoir provoqué les retransmissions TCP élevées.
Le RPM du SDS fournit un fichier de configuration appelé emc.conf dans le répertoire /opt/emc/scaleio/sds/cfg/. Ce fichier inclut de nombreux paramètres de système d’exploitation recommandés par Dell.
S’il s’agit d’un environnement rack/appliance PowerFlex, PowerFlex Manager copie automatiquement le fichier emc.conf de « /opt/emc/scaleio/sds/cfg » vers chaque fichier systcl.conf du serveur et l’applique. Cela se produira uniquement sur le déploiement initial du nœud. Il est possible que sysctl.conf n’ait pas été mis à jour correctement. Si le fichier sysctl.conf n’existe pas avec les valeurs correctes, après une mise à niveau du noyau vers la version 5.x, il est possible que certains paramètres importants changent.
Solution
Dans un environnement rack/appliance PowerFlex, si le fichier sysctl.conf n’inclut pas tous les paramètres du fichier emc.conf, il est recommandé de copier le fichier emc.conf dans chaque fichier /etc/sysctl.conf du serveur. Pour appliquer les modifications sur le serveur. Le serveur peut être redémarré ou la commande « sysctl -p » peut être exécutée pour appliquer les modifications à partir de /etc/sysctl.conf. Assurez-vous que les bonnes pratiques de maintenance sont appliquées lorsque vous apportez ces modifications.
Dans un environnement logiciel uniquement, Dell Technologies recommande d’appliquer ces paramètres Linux à chacun des serveurs, mais en fin de compte, c’est l’entreprise qui décide. Consultez le fournisseur du système d’exploitation pour connaître les pratiques d’excellence ou en cas de doute.
Versions affectées
Toutes les versions de PowerFlex