PowerProtect Data Manager: I PPDM-BRUGERGRÆNSEFLADEN viser søgeklyngens status, at en bestemt søgenode er i mislykket tilstand
Summary: Søgenoden reagerer ikke, og indekseringsjob forbliver i køtilstand, da de ikke kan køre på mislykkede noder. Dette kan ske med en søgenode, der er udgivet 19.16 eller tidligere.
Symptoms
På søgenoden, som er i en mislykket tilstand, skal du gå til /var/log og kontrollere meddelelsesloggen. Du ser en post, der ligner:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Berørte versioner: 19.16 og derunder
Undersøgt af Dell Engineering i PPDMESC-6808
Cause
NFS-dæmonen i søgeklyngen når et OS-niveau "Blød låsning". For flere detaljer om en blød låsning, læs:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Løsning:
Log på søgenoden, hvor NFSD ikke svarede.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Dette leverer administrator- og rodlegitimationsoplysninger til søgenoderne. Åbn SSH-sessionen til den pågældende søgenode som administratorbruger, og kør følgende kommandoer:
echo 20 > /proc/sys/kernel/watchdog_thresh
Denne kommando ændrer vagthundens tærskel til 20. Anvendelse af denne konfigurationsændring fortsætter dog ikke ved ved genstart af serveren. Foretag følgende ændring for at bevare dette på tværs af servergenstart.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Permanent løsning: PowerProtect Data Manager version 19.16 P2 og 19.17+ version