VxRail: iSM "kører ikke", "kører begrænset funktionalitet" eller "er inaktiv (død)"
Summary: iSM er i tilstanden "kører ikke" eller "kører begrænset funktionalitet". I denne artikel beskrives metoder til løsning.
Symptoms
iDRAC Service Module (iSM) er en vigtig tjeneste på værter, så de kan indsamle oplysninger fra iDRAC til overvågning.
Dette kan vises i iDRAC som følgende tilstand.
Sådan kontrollerer du iSM-servicestatus:
Alle VxRail til og med 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
De kan have en af følgende statusser:
- iSM er aktiv (kører)
- Dette er den fuldt funktionelle tilstand
- iSM er aktiv (kører ikke)
- iSM er aktiv (kører begrænset funktionalitet)
- iSM er inaktiv (død)
Cause
Der er mange mulige årsager til dette problem. Et eksempel herpå er, at tjenesterne på iDRAC ikke er fuldt funktionelle, hvilket forhindrer iSM i at tale med den.
Enhver individuel grundlæggende årsag skal undersøges under normal teknisk gennemgang (logfiler, produktbemærkninger, Knowledge Base-artikler (KB'er) osv.) og eskaleres efter behov ved hjælp af standardprocesser (CTE, DE, EE).
Resolution
Udfør nedenstående trin for at løse dette problem:
-
Åbn en SSH-session for hver node, hvor iSM ikke kører på IDRAC.
Følg nedenstående trin på hver af noderne:
-
Først skal du koldgenstarte iDRAC for at genstarte operativsystemet. Hver af følgende metoder er måder at udføre denne opgave på; Det er ikke nødvendigvis at køre alle tre på grund af dette.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Stop iSM-tjenesten på noden.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Installer iSMPKIHelper
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Start iSM-tjeneste på node.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Indstil service fra 0 til 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Kør SupportAssistCollection-scriptet for at indsamle iDRAC-logfiler
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Hvis iSM er "aktiv (kører ikke)" og ikke kan gendannes inden "/etc/init.d/dcism-netmon-watchdog restart" eller "/etc/init.d/dellism": Det kan være relateret til følgende tjeneste.
Prøv at udføre følgende trin.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Følgende fungerer på samme måde som ovenfor:
7.0.x og ældre
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Hvis iSM-tilstanden er "inaktiv (død)", ændrer genstart af iSM-tjenesten ikke dens tilstand fra død. Forsøg på at fjerne, opgradere eller installere via iSM fører til følgende fejl.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Stop tjenesten for at få den til at frigive sin adgang til ovenstående tardisk. iSM-processer kan starte backup efter dette.
/etc/init.d/sfcbd-watchdog stop
Derefter kan du prøve at opgradere igen eller straks opdatere iSM manuelt som:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Hvor vSAN upgradeBundles-mapperne omfatter UUID'er, og ISM-versionen afhænger af, hvad VxRail-opgraderingen opgraderes til.
Hvis dette ikke løser problemet, skal du muligvis strømdræne noden.
Det anbefales først at prøve et virtuelt strømafløb, da det kan gøres eksternt. Fysisk strømafløb kræver fysisk adgang.
Dell EMC VxRail: Sådan udfører du fjernhjælpestrømsdræning af noden via iDRAC (Dell Support-konto er påkrævet for at se denne artikel)
Hvis problemet fortsætter, anbefales det at kontakte Dells tekniske support for at få hjælp. henvis til denne KB.