Dell VxRail: kontrola poprawności działania "ism_fix" lub "rac_fix" rozwiązująca problemy z iSM i iDRAC

Summary: VxVerify w VxRail Manager może próbować naprawić błąd iDRAC i iSM poprzez ponowne uruchomienie iDRAC i powiązanych usług węzłów VxRail.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxVerify w VxRail Manager może próbować naprawić błąd iDRAC i iSM poprzez ponowne uruchomienie iDRAC i powiązanych usług węzłów VxRail.
Przed uruchomieniem testów bezpośrednio na każdym węźle, przy użyciu VxVerify minion, VxVerify w programie VxRail Manager najpierw wysyła zapytanie do Dell iSM (dcism lub dellism).
Alternatywnie, jeśli podczas przeprowadzania kontroli poprawności działania zostały wykryte problemy z kontrolerem iDRAC, przed ponowną próbą sprawdzenia poprawności działania zostanie podjęta ta automatyczna poprawka.
Jeśli opcja Autopoprawka jest włączona (albo przez profil testowy, albo za pomocą argumentu --fix), próba poprawienia tego problemu trwa około 10 minut.

Wynik tej automatycznej korekty jest wymieniony jako jeden z następujących:
Wynik testu
Kod wyniku
    Interpretacja wyników
Przechodzić
0
Poprawianie stanu iSM było niepotrzebne lub nie zostało włączone w profilu testowym.
Ostrzeżenie
1
Po ponownym uruchomieniu urządzenie Dell iSM działało prawidłowo.
Błąd 2
Dell iSM oraz iDRAC zostały uruchomione ponownie, ale iSM nadal nie działał prawidłowo.
Krytyczny 3
Ten test nie ma krytycznego wyniku.
Ta poprawka może zostać również uruchomiona po uruchomieniu kontroli VxVerify, jeśli zapytania kontrolera iDRAC zakończą się niepowodzeniem. W takim przypadku stronnik VxVerify zostanie uruchomiony po raz drugi po wprowadzeniu poprawki. Powtarzające się testy sprawdzają, czy problemy z iSM i iDRAC zostały rozwiązane.
Każdy test, który zostanie zaliczony, nie jest wymieniony w raporcie podsumowującym, aby ułatwić czytanie.
Poniżej przedstawiono przykład wyników kontroli poprawności działania:
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

Operacja "ism_fix" jest uruchamiana przed minionami, a polecenia naprawy są uruchamiane zdalnie z VxRM za pomocą SSH. Na przykład:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autopoprawkę można również zobaczyć w vxv.log przed zdarzeniami minion_run:
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

Aby rozwiązać problem z nieuruchomionym modułem DCISM, wykonaj następujące czynności przez VxVerify, jeśli ta funkcja automatycznego korygowania jest włączona w profilu testowym:
  • Zatrzymaj usługi: sfcbd, dcism, PTAgent (jeśli jest obecny) i platforma-usługa
  • Uruchom ponownie kontroler iDRAC, a następnie odczekaj 5 minut, aż kontroler iDRAC wróci do trybu online
  • Usługi uruchamiania (wymienione powyżej)

Resolution

Automatyczna poprawka dla iSM zgłasza powodzenie lub niepowodzenie w zależności od stanu "dcism" lub "dellism" podczas zdalnego sondowania przez VxVerify. Stwory są następnie uruchamiane w normalny sposób.
Stan iSM jest ponownie testowany przy użyciu kontroli poprawności działania "dcism" bezpośrednio na tym węźle. Może to zgłosić inny wynik, ponieważ jest on odpytywany kilka minut po automatycznej poprawce. Jeśli wynik jest inny, test "dcism" powinien być postrzegany jako dokładniejszy wynik dla statusu iSM.

Wyniki poleceń uruchamiania usług można znaleźć w vxv.log (patrz artykuł 66460: Podręcznik rozwiązywania problemów VxVerify ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

Jeśli problem iSM nie może zostać naprawiony zgodnie z powyższymi krokami, które kontrola poprawności działania może uruchomić automatycznie, zapoznaj się z artykułem: Dell VxRail: Kontrola poprawności działania węzła kończy się niepowodzeniem dla testu „dcism”

Additional Information

Wymuszenie użycia ism_fix (ponowne uruchomienie kontrolera iDRAC)

Automatyczna poprawka uruchamia się, jeśli "dcism" lub "dellism" nie są uruchomione, gdy są odpytywane z VxRM. Ma to jednak zastosowanie tylko wtedy, gdy profil testowy lub --fix argument włącza automatyczną poprawkę.
Alternatywnie można zalecić ponowne uruchomienie kontrolera iDRAC w celu rozwiązania innych problemów, aby można było włączyć automatyczną poprawkę za pośrednictwem argumentu VxVerify. 
Jest to bezpieczniejszy sposób na odzyskanie komunikacji kontrolera iDRAC niż ponowne uruchomienie bezpośrednio z interfejsu użytkownika kontrolera iDRAC, ponieważ VxVerify zamknie iSM i powiązane usługi przed ponownym uruchomieniem kontrolera iDRAC, a następnie przywróci usługi we właściwej kolejności.
Argument override może żądać rozłożonego ponownego uruchomienia kontrolera iDRAC we wszystkich węzłach lub listy określonych węzłów.

Aby zastosować poprawkę do węzłów (nawet jeśli iSM działa normalnie), co spowoduje ponowne uruchomienie kontrolera iDRAC i powiązanych usług:

  • Możesz też wymusić procedurę ponownego uruchamiania iSM i iDRAC ("ism_fix") do wszystkich węzłów:

./vxverify.sh -a ism_fix=all​​​
  • Lub zastosuj "ism_fix" do określonych węzłów na liście (bez spacji) (będą działać krótkie lub w pełni kwalifikowane nazwy):

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

Powyższe przykłady pokazują metody Shell i Python uruchamiania VxVerify, ale argumenty będą działać z obiema składniami.
Argument -a (--additional-params) pozwala na podanie nieograniczonej liczby par argumentów, więc musi występować po wszystkich innych standardowych argumentach, takich jak --verbose

Gdy ten argument jest używany, przesłonięcie można zobaczyć w vxv.log w następujący sposób:

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.