PowerFlex 4.X : Délai de reconnexion MDM dû au délai d’expiration DNS

Résumé: Dans certains environnements, le redémarrage d’un MDM peut prendre environ 20 secondes avant de rejoindre à nouveau le cluster. Le retard se produit lors de l’initialisation d’ActiveMQ CMS, qui fait partie de la séquence de démarrage du MDM. Si la résolution des noms DNS est lente ou mal configurée, l’initialisation CMS se bloque jusqu’à ce que la recherche DNS expire. ...

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

  • Lorsque le processus MDM démarre, les éléments suivants s’affichent dans les logs :

  • Événements MDM : autre MDM ayant commencé à se connecter après 20 secondes

2025/12/12 20:53:06.835 MDM_CLI_CONF_COMMAND_RECEIVED INFO Command SWITCH_MDM_OWNERSHIP received, User: 'admin'.
2025/12/12 20:53:27.065 REMOTE_SYSLOG_MODULE_INITIALIZED INFO Initialized the remote syslog module
2025/12/12 20:53:27.065 MDM_MANAGER_START INFO MDM started with the role of Manager
2025/12/12 20:53:27.133 MDM_CLUSTER_CONNECTED INFO The MDM, server-014 (ID 000000000000000e), connected after 2000ms

 

  • Dans les journaux de suivi MDM, un écart de ~20 secondes peut être observé lors de l’initialisation de CMS :
2025/12/12 20:53:07.022040 LOW:000000000000:mosTrcLayer_Create:00210: ---------- Process started. Version private PowerFlex R4_5.4000.111_Release, CodeBase , Feb 20 2025. PID 9138 ----------
2025/12/12 20:53:07.061777 LOW:7fe11c4fadb0:amqEventMgr_Init:00037: Starting AMQ CMS initialization <<<=======
2025/12/12 20:53:27.064872 LOW:7fe11c4fadb0:amqProducer_Create:00323: Creating events handler
2025/12/12 20:53:27.065210 LOW:7fe11c4fadb0:amqEventMgr_Init:00048: Finished AMQ CMS initialization <<<=======

Impact

Le temps de démarrage du processus MDM est prolongé, ce qui augmente le temps nécessaire au MDM pour se reconnecter au cluster. Ce délai peut être observé lors des opérations de redémarrage d’un MDM, telles que :

  • Basculement de propriété MDM
  • Redémarrage du service MDM
  • Redémarrage du nœud
  • Autres événements déclenchant un redémarrage du MDM

Par conséquent, la mémoire Flash MDM_CLUSTER_CONNECTED L’événement s’affiche environ 20 secondes après le redémarrage, plutôt que immédiatement.

Cause

Lorsqu’un processus MDM démarre et tente de rejoindre le cluster, il effectue plusieurs étapes d’initialisation internes avant de devenir opérationnel. L’une de ces étapes est l’initialisation du framework d’événements et de notifications (CMS ActiveMQ), qui est utilisé pour la surveillance et les alertes système.

Actuellement, cette initialisation est la suivante :

  • Synchrone
  • Obligatoire avant l’établissement de l’appartenance au cluster

Par conséquent, le MDM ne peut pas rejoindre le cluster tant que l’initialisation de CMS n’est pas terminée. Si la résolution des noms DNS sur le nœud est lente ou mal configurée, l’initialisation de CMS peut attendre l’expiration des requêtes DNS, ce qui entraîne un délai de démarrage d’environ 20 secondes.

Résolution

Vérifiez que la configuration DNS et la résolution du nom d’hôte fonctionnent correctement sur les nœuds MDM.
Les commandes suivantes peuvent être utilisées pour tester les performances de résolution des noms d’hôte :

  1. Vérifiez la latence DNS :

    Remarque : Effectuez ces vérifications sur un MDM secondaire ou un nœud non primaire. Évitez de les exécuter sur le MDM principal.
    time hostname -f time getent hosts $(hostname -f)

    Le temps réel doit être inférieur à 1 seconde.

     Si les commandes prennent ~20 secondes ou si le délai d’expiration est élevé, cela indique un problème de résolution DNS.

     

  2. Vérifier la configuration
    DNSVérifiez le serveur DNS configuré dans /etc/resolv.conf

    • Vérifiez qu’un nameserver Des entrées existent.

    • Vérifiez que les serveurs DNS configurés sont accessibles.

    Corrigez la configuration DNS ou les paramètres de résolution de nom d’hôte sur le nœud concerné et exécutez à nouveau les tests.

    Remarque : Effectuez ces vérifications sur un MDM secondaire ou un nœud non primaire. Évitez de les exécuter sur le MDM principal.

     

  3. Vérifier l’accessibilité du serveur DNS

    Testez la connectivité aux serveurs DNS configurés :

    ping <dns_server_ip>

 

  1. Testez à nouveau la latence DNS fournie à l’étape 1.

  2. Une fois que la résolution DNS fonctionne correctement, vous pouvez effectuer un test en redémarrant le processus MDMpour vérifier si MDM rejoint le cluster dans un délai d’environ deux secondes.

    Remarque : Effectuez le redémarrage du processus MDM uniquement sur un MDM secondaire ou en veille. Ne redémarrez pas le processus sur le MDM principal. Vous pouvez vérifier l’état du cluster via 'scli --query_cluster' 

 

Versions affectées

PowerFlex 4.x

Problème résolu dans la version

N/A - Problème environnemental/de configuration

Produits concernés

PowerFlex rack, ScaleIO
Propriétés de l’article
Numéro d’article: 000438735
Type d’article: Solution
Dernière modification: 12 Mar 2026
Version:  4
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.