PowerProtect Data Manager : Dans l’interface utilisateur PPDM, l’état du cluster de recherche indique qu’un nœud de recherche particulier est en état d’échec
Summary: Le nœud de recherche ne répond plus et les tâches d’indexation restent dans une file d’attente, car elles ne peuvent pas s’exécuter sur les nœuds défaillants. Cela peut se produire avec un nœud Search version 19.16 ou antérieure. ...
Symptoms
Sur le nœud de recherche qui est à l’état Failed, accédez à /var/log et vérifiez le journal des messages. Vous voyez une entrée semblable à :
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Versions concernées : 19.16 et versions antérieures
Procédure examinée par les ingénieurs Dell dans PPDMESC-6808
Cause
Le processus NFS sur le cluster de recherche atteint un « blocage logiciel » au niveau du système d’exploitation. Pour plus d’informations sur un blocage logiciel, lisez :
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Solution de contournement :
Connectez-vous au nœud de recherche sur lequel nfsd ne répond pas.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Cela fournit les informations d’identification root et d’administrateur pour les nœuds de recherche. Ouvrez une session SSH sur le nœud de recherche en question en tant qu’utilisateur administrateur et exécutez les commandes suivantes :
echo 20 > /proc/sys/kernel/watchdog_thresh
Cette commande modifie le seuil de surveillance sur 20. Toutefois, l’application de cette modification de configuration ne persiste pas lors du redémarrage du serveur. Apportez la modification suivante pour que cela persiste lors du redémarrage du serveur.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Correctif permanent : PowerProtect Data Manager versions 19.16 P2 et 19.17+