Dell VxRail: kuntotarkistus ism_fix tai rac_fix, joka korjaa iSM- ja iDRAC-ongelmat
Summary: VxRail Managerin VxVerify voi yrittää korjata iDRAC- ja iSM-viat käynnistämällä iDRACin ja siihen liittyvät VxRail-solmupalvelut uudelleen.
Symptoms
Ennen kuin testit suoritetaan suoraan kussakin solmussa VxVerify-minionin avulla, VxRail Managerin VxVerify tekee ensin kyselyn Dell iSM:lle (dcism tai dellism).
Jos kuntotarkastuksissa havaitaan iDRAC-ongelmia, automaattista korjausta yritetään ennen kuntotarkastusten jatkamista.
Jos automaattinen korjaus on käytössä (joko testiprofiililla tai argumentilla --fix), korjausyritys kestää noin 10 minuuttia.
Tämän automaattisen korjauksen tulos näkyy jonain seuraavista:
|
Testitulos
|
Tuloskoodi
|
Tulosten tulkinta
|
|
Ei vikaa
|
0
|
iSM-tilan korjaaminen oli joko tarpeetonta tai sitä ei otettu käyttöön testiprofiilissa.
|
|
Warning
|
1
|
Dell iSM -tila toimi oikein uudelleenkäynnistyksen jälkeen. |
| Epäonnistuminen | 2 |
Dell iSM ja iDRAC käynnistettiin uudelleen, mutta iSM ei vieläkään toiminut oikein sen jälkeen.
|
| Kriittinen | 3 |
Tällä testillä ei ole kriittistä tulosta.
|
Jokaista hyväksyttyä testiä ei luetella yhteenvetoraportissa lukemisen helpottamiseksi.
Seuraavassa on esimerkki kuntotarkastuksen tuloksista:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |ism_fix-toiminto suoritetaan ennen kätyreitä, ja korjauskomennot suoritetaan etänä VxRM:stä SSH:n avulla. Esimerkki:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutomaattinen korjaus näkyy myös minion_run tapahtumia edeltävässä vxv.log:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Pysäytä palvelut: sfcbd, dcism, PTAgent (jos on) & Platform-service
- Käynnistä iDRAC uudelleen ja odota 5 minuuttia, kunnes iDRAC palaa online-tilaan
- Käynnistä palvelut (lueteltu yllä)
Resolution
iSM-tila testataan uudelleen suoraan solmun dcism-kuntotarkistuksella. Tämä voi ilmoittaa erilaisen tuloksen, koska sitä kysytään muutama minuutti automaattisen korjauksen jälkeen. Jos tulos on erilainen, dcism-testiä on pidettävä iSM:n tilan tarkempana tuloksena.
Palvelujen käynnistyskomentojen tulokset löytyvät vxv.log (katso artikkeli 66460: VxVerify-vianmääritysopas ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Jos iSM:ää ei voida korjata yllä olevilla ohjeilla, jotka kuntotarkistus voi suorittaa automaattisesti, katso artikkeli: Dell VxRail: Solmun kuntotarkistus epäonnistuu testissä "dcism"
Additional Information
Pakota ism_fix käyttö (iDRAC:n uudelleenkäynnistys)
Automaattinen korjaus suoritetaan, jos dcism tai dellism ei ole käynnissä, kun niitä kysellään VxRM:stä. Tämä pätee kuitenkin vain, jos testiprofiili tai --fix-argumentti ottaa automaattisen korjauksen käyttöön.
Vaihtoehtoisesti iDRACin uudelleenkäynnistystä voidaan suositella muiden ongelmien korjaamiseksi, jolloin automaattinen korjaus voidaan ottaa käyttöön VxVerify-argumentin avulla.
Tämä on turvallisempi tapa palauttaa iDRAC-tietoliikenne kuin uudelleenkäynnistys suoraan iDRAC-käyttöliittymästä, koska VxVerify sammuttaa iSM:n ja siihen liittyvät palvelut ennen iDRACin uudelleenkäynnistystä ja palauttaa palvelut oikeaan järjestykseen myöhemmin.
Ohitusargumentti voi joko pyytää kaikkien solmujen porrastettua iDRAC-uudelleenkäynnistystä tai tiettyjen solmujen luetteloa.
Korjauksen tekeminen solmuissa (vaikka iSM toimisi normaalisti), jotka käynnistävät iDRACin ja siihen liittyvät palvelut uudelleen:
-
Joko pakota iSM- ja iDRAC-uudelleenkäynnistysmenettely ('ism_fix') kaikkiin solmuihin:
./vxverify.sh -a ism_fix=all
-
Voit myös käyttää ism_fix-kirjainta luettelon tiettyihin solmuihin (ei välilyöntejä) (joko lyhyet tai täysin pätevät nimet toimivat):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Yllä olevissa esimerkeissä näytetään VxVerifyn Shell- ja Python-suoritustavat, mutta argumentit toimivat kummassakin syntaksissa.
-a-argumentti (--additional-params) sallii rajoittamattoman määrän argumenttipareja, joten sen on oltava kaikkien muiden vakioargumenttien jälkeen, kuten --verbose
Kun tätä argumenttia käytetään, ohitus voidaan nähdä vxv.log seuraavasti:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all