VxRail: iSM «kjører ikke», «kjører begrenset funksjonalitet» eller «er inaktiv (død)»
Summary: iSM er i tilstanden "kjører ikke" eller "kjører begrenset funksjonalitet." Denne artikkelen beskriver metoder for å løse.
Symptoms
iDRAC Service Module (iSM) er en viktig tjeneste verter kan bruke til å samle inn informasjon fra iDRAC for overvåking.
Dette kan vises i iDRAC som følgende tilstand.
Slik kontrollerer du status for iSM-tjenesten:
All VxRail through 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
De kan ha en av følgende statuser:
- iSM er aktiv (kjører)
- Dette er den fullt funksjonelle tilstanden
- iSM er aktiv (kjører ikke)
- iSM er aktiv (kjører begrenset funksjonalitet)
- iSM er inaktiv (død)
Cause
Det er mange mulige årsaker til dette problemet. Et eksempel på dette er at tjenestene på iDRAC ikke fungerer som de skal, slik at iSM ikke kan snakke med den.
Enhver individuell rotårsak bør undersøkes under normal teknisk gjennomgang (logger, produktmerknader, kunnskapsbaseartikler (KB), så videre) og eskaleres etter behov ved hjelp av standardprosesser (CTE, DE, EE).
Resolution
Følg trinnene nedenfor for å løse dette problemet:
-
Åpne en SSH-økt for hver node der iSM ikke kjører på IDRAC.
Følg trinnene nedenfor for hver av nodene:
-
Først må du starte iDRAC på nytt for å starte operativsystemet på nytt. Hver av følgende metoder er måter å utføre denne oppgaven på; Det er ikke nødvendigvis å kjøre alle tre på grunn av dette.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Stopp iSM-tjenesten på noden.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Installer iSMPKIHelper
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Start iSM-tjenesten på noden.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Angi service fra 0 til 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Kjør SupportAssistCollection-skriptet for å innhente iDRAC-logger
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Hvis iSM er "aktiv (kjører ikke)," og ikke kan gjenopprettes av "/etc/init.d/dcism-netmon-watchdog restart" eller "/etc/init.d/dellism": Det kan være relatert til følgende tjeneste.
Prøv følgende trinn.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Følgende fungerer på samme måte som ovenfor:
7.0.x og eldre
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Hvis iSM-tilstanden er "inaktiv (død)", endres ikke statusen fra død når du starter iSM-tjenesten på nytt. Forsøk på å fjerne, oppgradere eller installere via iSM fører til følgende feil.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Stopp tjenesten for å få den til å frigjøre tilgangen til tardisken ovenfor. iSM-prosesser kan starte sikkerhetskopiering etter dette.
/etc/init.d/sfcbd-watchdog stop
Deretter kan du prøve oppgraderingen på nytt eller umiddelbart oppdatere iSM manuelt som:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Hvor vSAN upgradeBundles-mappene involverer UUID-er og ISM-versjonen avhenger av hva VxRail-oppgraderingen oppgraderes til.
Hvis dette ikke løser problemet, må du kanskje tømme noden av og på.
Det anbefales å først prøve et virtuelt strømavløp, da det kan gjøres eksternt. Fysisk strømavløp krever fysisk tilgang.
Dell EMC VxRail: Slik utfører du ekstern ekstra strømtapping av en node via iDRAC (Dell Support-konto er nødvendig for å se denne artikkelen)
Hvis problemene vedvarer, anbefales det å kontakte Dells tekniske støtte for hjelp. referanse til denne KB.