PowerProtect Data Manager: In de PPDM-gebruikersinterface geeft de status van het zoekcluster aan dat een bepaald zoekknooppunt de status Mislukt heeft
Summary: Het zoekknooppunt reageert niet meer en indexeringstaken blijven in een wachtrijstatus omdat ze niet kunnen worden uitgevoerd op defecte knooppunten. Dit kan gebeuren met een zoekknooppunt dat release 19.16 of lager is. ...
Symptoms
Ga op het zoekknooppunt met de status Mislukt naar /var/log en controleer het berichtenlogboek. U ziet een vermelding die lijkt op:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Betreffende versies: 19.16 en lager
Onderzocht door Dell Engineering in PPDMESC-6808
Cause
De NFS-daemon in het zoekcluster bereikt het OS-niveau 'Soft lockup'. Lees voor meer informatie over een soft lockup:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Tijdelijke oplossing:
Meld u aan bij het zoekknooppunt met nfsd dat niet reageerde.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Dit levert de admin- en rootreferenties voor de zoekknooppunten. Open een SSH-sessie naar het zoekknooppunt in kwestie als de admin-gebruiker en voer de volgende opdrachten uit:
echo 20 > /proc/sys/kernel/watchdog_thresh
Met deze opdracht wordt de watchdog-drempelwaarde gewijzigd naar 20. Het toepassen van deze configuratiewijziging blijft echter niet bestaan bij het opnieuw opstarten van de server. Breng de volgende wijziging aan om dit te behouden bij het opnieuw opstarten van de server.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Permanente oplossing: PowerProtect Data Manager versie 19.16 P2 en 19.17+ release