PowerProtect Data Manager: I PPDM-grensesnittet viser statusen til søkeklyngen at en bestemt søkenode er i en mislykket tilstand
Summary: Søkenoden svarer ikke, og indekseringsjobber forblir i kø siden de ikke kan kjøre på mislykkede noder. Dette kan skje med en søkenode som har utgivelse 19.16 eller tidligere.
Symptoms
På søkenoden som er i en mislykket tilstand, gå til /var/log og sjekk meldingsloggen. Du ser en oppføring som ligner på:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Berørte versjoner: 19.16 og lavere
Undersøkt av Dell Engineering i PPDMESC-6808
Cause
NFS-bakgrunnsprosessen i søkeklyngen treffer "Soft lockup" på OS-nivå. Hvis du vil ha mer informasjon om en myk låsing, kan du lese:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Løsning:
Logg inn på søkenoden som hadde nfsd reagerte ikke.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Dette gir administrator- og rotlegitimasjon for søkenodene. Åpne SSH-økten til den aktuelle søkenoden som administratorbruker, og kjør følgende kommandoer:
echo 20 > /proc/sys/kernel/watchdog_thresh
Denne kommandoen endrer terskelen for vaktbikkje til 20. Bruk av denne konfigurasjonsendringen vedvarer imidlertid ikke over omstart av serveren. Gjør følgende endringer for å vedvare dette på tvers av omstart av serveren.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Permanent korrigering: PowerProtect Data Manager-versjon 19.16, P2- og 19.17+-versjon