PowerProtect Data Manager: PPDM-käyttöliittymässä hakuklusterin tila osoittaa, että tietty hakusolmu on epäonnistuneessa tilassa
Summary: Hakusolmu lakkaa vastaamasta ja indeksointityöt pysyvät jonossa, koska niitä ei voi suorittaa epäonnistuneissa solmuissa. Näin voi käydä, jos Search-solmussa on julkaisuversio 19.16 tai sitä vanhempi. ...
Symptoms
Valitse epäonnistuneessa Search Node -hakemistossa /var/log ja tarkista viestiloki. Näet seuraavanlaisen merkinnän:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Versiot, joita asia koskee: 19.16 ja vähemmän
Dell Engineering tutki PPDMESC-6808:aa
Cause
Hakuklusterin NFS-daemon saavuttaa käyttöjärjestelmätason "Soft lockup". Lisätietoja pehmeästä lukituksesta on lue:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Tilapäisratkaisu:
Kirjaudu hakusolmuun, jossa nfsd ei vastannut.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Tämä antaa hakusolmujen järjestelmänvalvojan ja pääkäyttäjän tunnistetiedot. Avaa SSH-istunto kyseiseen hakusolmuun admin-käyttäjänä ja suorita seuraavat komennot:
echo 20 > /proc/sys/kernel/watchdog_thresh
Tämä komento muuttaa vahtikoiran kynnysarvoksi 20. Tämän määritysmuutoksen ottaminen käyttöön ei kuitenkaan jatku palvelimen uudelleenkäynnistyksen jälkeen. Tee seuraava muutos, jos haluat säilyttää tämän myös palvelimen uudelleenkäynnistyksessä.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Pysyvä korjaus: PowerProtect Data Manager -versiot 19.16, P2 &; 19.17+ julkaisupäivä