PowerProtect Data Manager: V uživatelském rozhraní PPDM stav vyhledávacího clusteru ukazuje, že konkrétní vyhledávací uzel je ve stavu selhání
Summary: Uzel vyhledávání přestane reagovat a úlohy indexování zůstanou ve stavu fronty, protože je nelze spustit na uzlech, které selhaly. K tomu může dojít u uzlu Search, který je ve verzi 19.16 nebo starší. ...
Symptoms
V uzlu vyhledávání, který je ve stavu selhání, přejděte do umístění /var/log a zkontrolujte protokol zpráv. Zobrazí se položka podobná této:
2024-07-08T10:00:12.049322-04:00 search_node_name kernel: [518834.025665][ C1] watchdog: BUG: soft lockup - CPU#1 stuck for 235970s! [nfsd:2692]
Dotčené verze: 19.16 a nižší
Zkoumáno technickým oddělením společnosti Dell v bodě PPDMESC-6808
Cause
Démon NFS ve vyhledávacím clusteru dosáhne "měkkého uzamčení" na úrovni operačního systému. Další podrobnosti o měkkém uzamčení najdete tady:
https://www.suse.com/support/kb/doc/?id=000018705
Resolution
Alternativní řešení:
Přihlaste se do vyhledávacího uzlu, u kterého nfsd nereaguje.
source /opt/emc/vmdirect/unit/vmdirect.env && /opt/emc/vmdirect/bin/infranodemgmt get -secret
To poskytuje přihlašovací údaje správce a root pro vyhledávací uzly. Otevřete relaci SSH pro daný vyhledávací uzel jako uživatel admin a spusťte následující příkazy:
echo 20 > /proc/sys/kernel/watchdog_thresh
Tento příkaz upraví prahovou hodnotu sledovacího zařízení na 20. Použití této změny konfigurace se však nezachová po restartování serveru. Chcete-li to zachovat při restartování serveru, proveďte následující změnu.
echo "kernel.watchdog_thresh=20" > /etc/sysctl.d/99-watchdog_thresh.conf sysctl -p /etc/sysctl.d/99-watchdog_thresh.conf
Trvalá oprava: PowerProtect Data Manager verze 19.16 P2 a 19.17+