PowerFlex 4.X: Retraso en la reconexión de MDM debido al tiempo de espera agotado del DNS

Resumen: En ciertos entornos, un reinicio de MDM puede tardar aproximadamente 20 segundos antes de volver a unirse al clúster. El retraso se produce durante la inicialización de ActiveMQ CMS, que forma parte de la secuencia de inicio de MDM. Si la resolución de nombres DNS es lenta o está mal configurada, la inicialización de CMS se bloquea hasta que se agota el tiempo de espera de la búsqueda de DNS. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

  • Cuando se inicia el demonio de MDM, verá lo siguiente en los registros:

  • Eventos de MDM: otro MDM que comenzó a conectarse después de 20 segundos

2025/12/12 20:53:06.835 MDM_CLI_CONF_COMMAND_RECEIVED INFO Command SWITCH_MDM_OWNERSHIP received, User: 'admin'.
2025/12/12 20:53:27.065 REMOTE_SYSLOG_MODULE_INITIALIZED INFO Initialized the remote syslog module
2025/12/12 20:53:27.065 MDM_MANAGER_START INFO MDM started with the role of Manager
2025/12/12 20:53:27.133 MDM_CLUSTER_CONNECTED INFO The MDM, server-014 (ID 000000000000000e), connected after 2000ms

 

  • En los registros de seguimiento de MDM, se puede observar una brecha de ~20 segundos durante la inicialización de CMS:
2025/12/12 20:53:07.022040 LOW:000000000000:mosTrcLayer_Create:00210: ---------- Process started. Version private PowerFlex R4_5.4000.111_Release, CodeBase , Feb 20 2025. PID 9138 ----------
2025/12/12 20:53:07.061777 LOW:7fe11c4fadb0:amqEventMgr_Init:00037: Starting AMQ CMS initialization <<<=======
2025/12/12 20:53:27.064872 LOW:7fe11c4fadb0:amqProducer_Create:00323: Creating events handler
2025/12/12 20:53:27.065210 LOW:7fe11c4fadb0:amqEventMgr_Init:00048: Finished AMQ CMS initialization <<<=======

Impacto

El tiempo de inicio del demonio de MDM se extiende, lo que aumenta el tiempo necesario para que el MDM se vuelva a conectar al clúster. Este retraso se puede observar durante las operaciones que reinician un MDM, como las siguientes:

  • Cambio de propiedad de MDM
  • Reinicio del servicio MDM
  • Reinicio de nodo
  • Otros eventos que activan un reinicio de MDM

Como resultado, la MDM_CLUSTER_CONNECTED El evento aparece aproximadamente 20 segundos después del reinicio, en lugar de inmediatamente.

Causa

Cuando un demonio de MDM se inicia e intenta volver a unirse al clúster, realiza varios pasos de inicialización interna antes de entrar en funcionamiento. Uno de estos pasos es la inicialización de la infraestructura de eventos y notificaciones (CMS ActiveMQ), que se utiliza para alertas y monitoreo del sistema.

Actualmente, esta inicialización es:

  • Síncrono
  • Se requiere antes de que se establezca la membresía del clúster

Por lo tanto, el MDM no puede unirse al clúster hasta que se complete la inicialización de CMS. Si la resolución de nombres DNS en el nodo es lenta o está mal configurada, la inicialización de CMS puede esperar a que se agote el tiempo de espera de las consultas DNS, lo que da como resultado un retraso de inicio de aproximadamente 20 segundos.

Resolución

Verifique que la configuración de DNS y la resolución del nombre de host funcionen correctamente en los nodos de MDM.
Los siguientes comandos se pueden utilizar para probar el rendimiento de la resolución del nombre de host:

  1. Verifique la latencia de DNS:

    Nota: Realice estas comprobaciones en un MDM secundario o en un nodo no primario. Evite ejecutarlos en el MDM principal.
    time hostname -f time getent hosts $(hostname -f)

    El tiempo real debe ser inferior a 1 segundo.

     Si los comandos tardan ~20 segundos o se agota el tiempo de espera, indica un problema de resolución de DNS.

     

  2. Verificar la configuración
    de DNSCompruebe el servidor DNS configurado en /etc/resolv.conf

    • Verifique que un nameserver Las entradas existen.

    • Verifique que se pueda acceder a los servidores DNS configurados.

    Corrija la configuración de DNS o los ajustes de resolución del nombre de host en el nodo afectado y vuelva a ejecutar las pruebas.

    Nota: Realice estas comprobaciones en un MDM secundario o en un nodo no primario. Evite ejecutarlos en el MDM principal.

     

  3. Verificar la accesibilidad del servidor DNS

    Pruebe la conectividad a los servidores DNS configurados:

    ping <dns_server_ip>

 

  1. Vuelva a probar la latencia de DNS proporcionada en el paso 1.

  2. Una vez que la resolución de DNS funcione correctamente, puede realizar la prueba mediante el reinicio del demonio de MDMn para comprobar si MDM se reincorpora al clúster en aproximadamente un par de segundos.

    Nota: Realice el reinicio del demonio de MDM solo en un MDM secundario o en espera. No reinicie el demonio en la MDM principal. Puede comprobar el estado del clúster a través de 'scli --query_cluster' 

 

Versiones afectadas

PowerFlex 4.x

Problema corregido en la versión

N/D: problema de entorno/configuración

Productos afectados

PowerFlex rack, ScaleIO
Propiedades del artículo
Número del artículo: 000438735
Tipo de artículo: Solution
Última modificación: 12 mar. 2026
Versión:  4
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.