VxRail: Modul iSM "is not running", "running limited functionality" nebo "is inactive (dead)"
Summary: Modul iSM je ve stavu "není spuštěn" nebo "spuštěna omezená funkčnost". Tento článek popisuje metody řešení.
Symptoms
Servisní modul iDRAC (iSM) je důležitou službou na hostitelích, aby bylo možné shromažďovat informace z řadiče iDRAC pro účely monitorování.
V řadiči iDRAC se může zobrazit jako následující stav.
Kontrola stavu služby iSM:
Všechny VxRail až 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
Mohou mít jeden z následujících stavů:
- Modul iSM je aktivní (spuštěný)
- Toto je plně funkční stav
- iSM is active (not running)
- Modul iSM je aktivní (běží na něm omezená funkčnost)
- Modul iSM je neaktivní (nefunkční)
Cause
Existuje mnoho možných příčin tohoto problému. Jedním z takových příkladů je, že služby v řadiči iDRAC nejsou plně funkční, což brání modulu iSM s ním komunikovat.
Každá jednotlivá příčina by měla být prošetřena v rámci běžné technické kontroly (protokoly, poznámky k verzi, články znalostní databáze atd.) a v případě potřeby eskalována pomocí standardních procesů (CTE, DE, EE).
Resolution
Problém vyřešíte pomocí níže uvedeného postupu:
-
Otevřete relaci SSH pro každý uzel, u kterého modul iSM není spuštěn na řadiči iDRAC.
U každého z uzlů postupujte podle následujících kroků:
-
Nejprve za studena restartujte řadič iDRAC, aby se restartoval operační systém. Každá z následujících metod je způsob, jak tento úkol splnit; Z tohoto důvodu nemusí být nutně spuštěny všechny tři.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Zastavte službu iSM na uzlu.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Nainstalujte nástroj iSMPKIHelper.
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Spusťte na uzlu službu iSM.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Nastavení služby od 0 do 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Spuštěním skriptu SupportAssistCollection shromážděte protokoly řadiče iDRAC
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Pokud je modul iSM ve stavu "active (not running)" a nelze jej obnovit pomocí "/etc/init.d/dcism-netmon-watchdog restart" nebo "/etc/init.d/dellism": může souviset s následující službou.
Vyzkoušejte následující postup.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Následující fungují stejně jako výše:
7.0.x a starší
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Pokud je stav iSM "neaktivní (nefunkční)", restartování služby iSM nezmění její stav z mrtvého. Pokus o odebrání, upgrade nebo instalaci přes iSM vede k následující chybě.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Zastavte službu, aby uvolnila přístup k výše uvedenému tardisku. Poté mohou procesy iSM spustit zálohování.
/etc/init.d/sfcbd-watchdog stop
Poté můžete upgrade zopakovat nebo iSM okamžitě aktualizovat ručně, protože to znamená:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
To, kde složky balíčků upgradu vSAN zahrnují identifikátory UUID, a verze ISM závisí na tom, na co se upgrade VxRail upgraduje.
Pokud se tím problém nevyřeší, možná bude nutné uzel vybít.
Doporučuje se nejprve vyzkoušet virtuální vybíjení energie, protože to lze provést na dálku. Fyzické vybíjení energie vyžaduje fyzický přístup.
Dell EMC VxRail: Jak provést vzdálené pomocné vybíjení napájení uzlu prostřednictvím řadiče iDRAC (k přečtení tohoto článku je vyžadován účet podpory Dell)
Pokud potíže přetrvávají, doporučujeme požádat o pomoc technickou podporu společnosti Dell. Viz tento článek znalostní databáze.