Dell VxRail: kontrola stavu "ism_fix" nebo "rac_fix" opravující problémy s moduly iSM a iDRAC.

Summary: Nástroj VxVerify v nástroji VxRail Manager se může pokusit opravit chybu řadiče iDRAC a iSM restartováním řadiče iDRAC a souvisejících služeb uzlu VxRail.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Nástroj VxVerify v nástroji VxRail Manager se může pokusit opravit chybu řadiče iDRAC a iSM restartováním řadiče iDRAC a souvisejících služeb uzlu VxRail.
Před spuštěním testů přímo na každém uzlu pomocí nástroje VxVerify minion se nástroj VxVerify v nástroji VxRail Manager nejprve dotázá na modul Dell iSM (dcismus nebo dellismus).
Případně, pokud byly při spuštění kontrol stavu zjištěny problémy s řadičem iDRAC, provede se před opakováním kontroly stavu pokus o tuto automatickou opravu.
Pokud je povolena možnost Automatická oprava (pomocí testovacího profilu nebo pomocí argumentu --fix), pokus o opravu trvá přibližně 10 minut.

Výsledek této automatické opravy je uveden jako jeden z následujících:
Výsledek testu
Kód výsledku
    Interpretace výsledků
Úspěch
0
Oprava stavu modulu iSM byla zbytečná nebo nebyla v rámci testovacího profilu povolena.
Warning
1
Stav nástroje Dell iSM po restartování fungoval správně.
Failure 2
Nástroje Dell iSM a iDRAC byly restartovány, ale iSM ani poté nefungoval správně.
Kritická 3
Tento test nemá žádný kritický výsledek.
Tato oprava může být také spuštěna po spuštění kontrol VxVerify, pokud dotazy iDRAC selžou. V takovém případě se po opravě spustí program minion VxVerify podruhé. Opakované testy zkontrolují, zda jsou opraveny problémy s moduly iSM a iDRAC.
Každý test, který uspěje, není uveden v souhrnné zprávě, aby se usnadnilo čtení.
Níže je uveden příklad výstupu kontroly stavu:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

Operace "ism_fix" se spustí před miniony a opravné příkazy se spouštějí vzdáleně z nástroje VxRM pomocí SSH. Například:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Automatická oprava se zobrazuje také v vxv.log před událostmi minion_run:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

Pokud je tato funkce automatické nápravy v testovacím profilu povolena, proveďte následující kroky pomocí nástroje VxVerify:
  • Stop služby: sfcbd, dcism, PTAgent (pokud je k dispozici) a platformová služba
  • Restartujte řadič iDRAC a počkejte 5 minut, než se řadič iDRAC znovu připojí
  • Spustit služby (uvedené výše)

Resolution

Automatická oprava pro modul iSM hlásí úspěch nebo selhání v závislosti na stavu "dcism" nebo "dellism" při vzdáleném dotazování nástrojem VxVerify. Přisluhovači se pak spustí jako obvykle.
Stav iSM se znovu otestuje pomocí kontroly stavu dcism přímo na tomto uzlu. To může hlásit jiný výsledek, protože se dotazuje několik minut po automatické opravě. Pokud se výsledek liší, měl by být test "dcismu" považován za přesnější výsledek pro stav iSM.

Výsledky příkazů pro spuštění služeb naleznete v vxv.log (viz článek 66460: Průvodce odstraňováním problémů s nástrojem VxVerify ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Pokud modul iSM nelze opravit pomocí výše uvedených kroků, které lze spustit automaticky, přečtěte si článek: Dell VxRail: U testu „dcism“ selže kontrola stavu uzlu

Additional Information

Vynucení použití ism_fix (restartování řadiče iDRAC)

Automatická oprava se spustí, pokud nejsou spuštěné příkazy "dcism" nebo "dellism", když jsou dotazovány z nástroje VxRM. To však platí pouze v případě, že testovací profil nebo --fix argument povoluje automatickou opravu.
Případně lze doporučit restartování řadiče iDRAC za účelem vyřešení dalších problémů, a proto lze automatickou opravu povolit přes argument VxVerify. 
Jedná se o bezpečnější způsob obnovení komunikace řadiče iDRAC než restartování přímo z uživatelského rozhraní řadiče iDRAC, protože nástroj VxVerify před restartováním řadiče iDRAC vypne modul iSM a související služby a poté služby opět obnoví ve správném pořadí.
Argument override může buď požadovat, aby všechny uzly provedly střídavý restart řadiče iDRAC, nebo seznam konkrétních uzlů.

Použití opravy u uzlů (i když modul iSM funguje normálně), které restartují řadič iDRAC a související služby:

  • Buď přinuceně spusťte postup restartování modulu iSM a řadiče iDRAC (ism_fix) na všechny uzly:

./vxverify.sh -a ism_fix=all​​​
  • Nebo použijte ism_fix na zadané uzly v seznamu (bez mezer) (budou fungovat krátké nebo plně kvalifikované názvy):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Výše uvedené příklady ukazují metody prostředí a Python pro spuštění nástroje VxVerify, ale argumenty budou fungovat s oběma druhy syntaxe.
Argument -a (--additional-params) umožňuje zadat neomezený počet dvojic argumentů, takže musí následovat po všech ostatních standardních argumentech, například --verbose

Při použití tohoto argumentu se přepsání v vxv.log zobrazí následovně:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.