VxRail: iSM "körs inte", "kör begränsad funktionalitet" eller "är inaktiv (död)"
Summary: iSM är i ett tillstånd av "körs inte" eller "kör begränsad funktionalitet". I den här artikeln beskrivs metoder för att lösa problem.
Symptoms
iDRAC Service Module (iSM) är en viktig tjänst på värdar för att kunna samla in information från iDRAC för övervakning.
Detta kan visas i iDRAC som följande läge.
Så här kontrollerar du iSM-tjänstens status:
Alla VxRail till och med 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
De kan ha någon av följande statusar:
- iSM är aktivt (körs)
- Detta är det fullt fungerande tillståndet
- iSM är aktivt (körs inte)
- iSM är aktivt (med begränsad funktionalitet)
- iSM är inaktiv (död)
Cause
Det finns många möjliga orsaker till det här problemet. Ett exempel är att tjänsterna på iDRAC inte fungerar fullt ut, vilket hindrar iSM från att prata med den.
Eventuella enskilda grundorsaker bör undersökas under normal teknisk granskning (loggar, versionskommentarer, kunskapsbasartiklar (KB:er) osv.) och vid behov eskaleras med hjälp av standardprocesser (CTE, DE, EE).
Resolution
Följ anvisningarna nedan för att lösa problemet:
-
Öppna en SSH-session till varje nod där iSM inte körs på IDRAC.
Följ stegen nedan på var och en av noderna:
-
Starta först om iDRAC kallt för att starta om operativsystemet. Var och en av följande metoder är sätt att utföra denna uppgift; Det är inte nödvändigtvis att köra alla tre på grund av detta.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Stoppa iSM-tjänsten på noden.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Installera iSMPKIHelper.
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Starta iSM-tjänsten på noden.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Ställ in tjänsten från 0 till 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Kör SupportAssistCollection-skriptet för att samla in iDRAC-loggar.
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Om iSM är "aktiv (körs inte)" och inte kan återställas med "/etc/init.d/dcism-netmon-watchdog restart" eller "/etc/init.d/dellism": Det kan vara relaterat till följande tjänst.
Försök med följande steg:
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Följande fungerar på samma sätt som ovan:
7.0.x och äldre
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Om iSM-tillståndet är "inaktivt (dött)" ändras inte tillståndet från dött när iSM-tjänsten startas om. Om du försöker ta bort, uppgradera eller installera över iSM visas följande fel.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Stoppa tjänsten så att den släpper sin åtkomst till tardisken ovan. iSM-processer kan starta säkerhetskopiering efter detta.
/etc/init.d/sfcbd-watchdog stop
Sedan kan du försöka uppgradera igen eller omedelbart uppdatera iSM manuellt som:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Om vSAN upgradeBundles-mapparna omfattar UUID:n och ISM-versionen beror på vad VxRail-uppgraderingen uppgraderas till.
Om detta inte löser problemet kan du behöva tömma noden på ström.
Vi rekommenderar att du först provar en virtuell strömtömning eftersom det kan göras på distans. Fysisk strömförbrukning kräver fysisk åtkomst.
Dell EMC VxRail: Så här utför du fjärrstyrd tömning av extra ström från noden via iDRAC (Dell-supportkonto krävs för att se den här artikeln)
Om problemet kvarstår rekommenderar vi att du kontaktar Dells tekniska support för att få hjälp. Mer information finns i den här kunskapsbasartikeln.