PowerProtect Data Manager: En la interfaz del usuario de PPDM, el estado del clúster de búsqueda muestra que un nodo de búsqueda específico se encuentra en un estado fallido
Summary: El nodo de búsqueda deja de responder y los trabajos de indexación permanecen en un estado en línea de espera, ya que no se pueden ejecutar en nodos fallidos. Esto puede suceder con un nodo de búsqueda que sea 19.16 o anterior. ...
Symptoms
En el nodo de búsqueda que se encuentra en un estado fallido, vaya a /var/log y compruebe el registro de mensajes. Verá una entrada similar a la siguiente:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Versiones afectadas: 19.16 y versiones anteriores
Investigado por el equipo de ingeniería de Dell en PPDMESC-6808
Cause
El demonio de NFS en el clúster de búsqueda alcanza un "bloqueo suave" en el nivel del sistema operativo. Para obtener más detalles sobre un bloqueo parcial, lea lo siguiente https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Solución alternativa:
Inicie sesión en el nodo de búsqueda en el que nfsd no respondió.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Esto proporciona las credenciales de administrador y raíz para los nodos de búsqueda. Abra la sesión SSH en el nodo de búsqueda en cuestión como usuario administrador y ejecute los siguientes comandos:
echo 20 > /proc/sys/kernel/watchdog_thresh
Este comando modifica el umbral de vigilancia a 20. Sin embargo, la aplicación de este cambio en la configuración no persiste durante el reinicio del servidor. Realice el siguiente cambio para que esto persista en el reinicio del servidor.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Corrección permanente: Versión 19.16 P2 y 19.17+ de PowerProtect Data Manager