Dell VxRail: kontrola stavu "ism_fix" nebo "rac_fix" opravující problémy s moduly iSM a iDRAC.
Summary: Nástroj VxVerify v nástroji VxRail Manager se může pokusit opravit chybu řadiče iDRAC a iSM restartováním řadiče iDRAC a souvisejících služeb uzlu VxRail.
Symptoms
Před spuštěním testů přímo na každém uzlu pomocí nástroje VxVerify minion se nástroj VxVerify v nástroji VxRail Manager nejprve dotázá na modul Dell iSM (dcismus nebo dellismus).
Případně, pokud byly při spuštění kontrol stavu zjištěny problémy s řadičem iDRAC, provede se před opakováním kontroly stavu pokus o tuto automatickou opravu.
Pokud je povolena možnost Automatická oprava (pomocí testovacího profilu nebo pomocí argumentu --fix), pokus o opravu trvá přibližně 10 minut.
Výsledek této automatické opravy je uveden jako jeden z následujících:
|
Výsledek testu
|
Kód výsledku
|
Interpretace výsledků
|
|
Úspěch
|
0
|
Oprava stavu modulu iSM byla zbytečná nebo nebyla v rámci testovacího profilu povolena.
|
|
Warning
|
1
|
Stav nástroje Dell iSM po restartování fungoval správně. |
| Failure | 2 |
Nástroje Dell iSM a iDRAC byly restartovány, ale iSM ani poté nefungoval správně.
|
| Kritická | 3 |
Tento test nemá žádný kritický výsledek.
|
Každý test, který uspěje, není uveden v souhrnné zprávě, aby se usnadnilo čtení.
Níže je uveden příklad výstupu kontroly stavu:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |Operace "ism_fix" se spustí před miniony a opravné příkazy se spouštějí vzdáleně z nástroje VxRM pomocí SSH. Například:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutomatická oprava se zobrazuje také v vxv.log před událostmi minion_run:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stop služby: sfcbd, dcism, PTAgent (pokud je k dispozici) a platformová služba
- Restartujte řadič iDRAC a počkejte 5 minut, než se řadič iDRAC znovu připojí
- Spustit služby (uvedené výše)
Resolution
Stav iSM se znovu otestuje pomocí kontroly stavu dcism přímo na tomto uzlu. To může hlásit jiný výsledek, protože se dotazuje několik minut po automatické opravě. Pokud se výsledek liší, měl by být test "dcismu" považován za přesnější výsledek pro stav iSM.
Výsledky příkazů pro spuštění služeb naleznete v vxv.log (viz článek 66460: Průvodce odstraňováním problémů s nástrojem VxVerify ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Pokud modul iSM nelze opravit pomocí výše uvedených kroků, které lze spustit automaticky, přečtěte si článek: Dell VxRail: U testu „dcism“ selže kontrola stavu uzlu
Additional Information
Vynucení použití ism_fix (restartování řadiče iDRAC)
Automatická oprava se spustí, pokud nejsou spuštěné příkazy "dcism" nebo "dellism", když jsou dotazovány z nástroje VxRM. To však platí pouze v případě, že testovací profil nebo --fix argument povoluje automatickou opravu.
Případně lze doporučit restartování řadiče iDRAC za účelem vyřešení dalších problémů, a proto lze automatickou opravu povolit přes argument VxVerify.
Jedná se o bezpečnější způsob obnovení komunikace řadiče iDRAC než restartování přímo z uživatelského rozhraní řadiče iDRAC, protože nástroj VxVerify před restartováním řadiče iDRAC vypne modul iSM a související služby a poté služby opět obnoví ve správném pořadí.
Argument override může buď požadovat, aby všechny uzly provedly střídavý restart řadiče iDRAC, nebo seznam konkrétních uzlů.
Použití opravy u uzlů (i když modul iSM funguje normálně), které restartují řadič iDRAC a související služby:
-
Buď přinuceně spusťte postup restartování modulu iSM a řadiče iDRAC (ism_fix) na všechny uzly:
./vxverify.sh -a ism_fix=all
-
Nebo použijte ism_fix na zadané uzly v seznamu (bez mezer) (budou fungovat krátké nebo plně kvalifikované názvy):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Výše uvedené příklady ukazují metody prostředí a Python pro spuštění nástroje VxVerify, ale argumenty budou fungovat s oběma druhy syntaxe.
Argument -a (--additional-params) umožňuje zadat neomezený počet dvojic argumentů, takže musí následovat po všech ostatních standardních argumentech, například --verbose
Při použití tohoto argumentu se přepsání v vxv.log zobrazí následovně:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all