PowerProtect Data Manager: I PPDM-användargränssnittet visar sökklustrets status att en viss söknod är i ett felaktigt tillstånd
Summary: Söknoden svarar inte och indexeringsjobb förblir i ett kötillstånd eftersom de inte kan köras på misslyckade noder. Detta kan inträffa med en söknod som är version 19.16 eller tidigare. ...
Symptoms
På söknoden som är i ett misslyckat tillstånd går du till /var/log och kontrollerar meddelandeloggen. Du ser en post som liknar:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Berörda versioner: 19.16 och lägre
Undersökt av Dell Engineering i PPDMESC-6808
Cause
NFS-daemonen i sökklustret når OS-nivån "Mjuk låsning". För mer information om en mjuk låsning, läs:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Lösning:
Logga in på söknoden där nfsd inte svarade.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
Detta tillhandahåller administratörs- och rotinloggningsuppgifter för söknoderna. Öppna SSH-sessionen till söknoden i fråga som administratörsanvändare och kör följande kommandon:
echo 20 > /proc/sys/kernel/watchdog_thresh
Det här kommandot ändrar tröskelvärdet för watchdog till 20. Tillämpningen av den här konfigurationsändringen kvarstår dock inte under omstart av servern. Gör följande ändring för att spara detta vid omstart av servern.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Permanent lösning: PowerProtect Data Manager version 19.16 P2 och 19.17+ version