Dell VxRail: kontrola poprawności działania "ism_fix" lub "rac_fix" rozwiązująca problemy z iSM i iDRAC
Summary: VxVerify w VxRail Manager może próbować naprawić błąd iDRAC i iSM poprzez ponowne uruchomienie iDRAC i powiązanych usług węzłów VxRail.
Symptoms
Przed uruchomieniem testów bezpośrednio na każdym węźle, przy użyciu VxVerify minion, VxVerify w programie VxRail Manager najpierw wysyła zapytanie do Dell iSM (dcism lub dellism).
Alternatywnie, jeśli podczas przeprowadzania kontroli poprawności działania zostały wykryte problemy z kontrolerem iDRAC, przed ponowną próbą sprawdzenia poprawności działania zostanie podjęta ta automatyczna poprawka.
Jeśli opcja Autopoprawka jest włączona (albo przez profil testowy, albo za pomocą argumentu --fix), próba poprawienia tego problemu trwa około 10 minut.
Wynik tej automatycznej korekty jest wymieniony jako jeden z następujących:
|
Wynik testu
|
Kod wyniku
|
Interpretacja wyników
|
|
Przechodzić
|
0
|
Poprawianie stanu iSM było niepotrzebne lub nie zostało włączone w profilu testowym.
|
|
Ostrzeżenie
|
1
|
Po ponownym uruchomieniu urządzenie Dell iSM działało prawidłowo. |
| Błąd | 2 |
Dell iSM oraz iDRAC zostały uruchomione ponownie, ale iSM nadal nie działał prawidłowo.
|
| Krytyczny | 3 |
Ten test nie ma krytycznego wyniku.
|
Każdy test, który zostanie zaliczony, nie jest wymieniony w raporcie podsumowującym, aby ułatwić czytanie.
Poniżej przedstawiono przykład wyników kontroli poprawności działania:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |Operacja "ism_fix" jest uruchamiana przed minionami, a polecenia naprawy są uruchamiane zdalnie z VxRM za pomocą SSH. Na przykład:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutopoprawkę można również zobaczyć w vxv.log przed zdarzeniami minion_run:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Zatrzymaj usługi: sfcbd, dcism, PTAgent (jeśli jest obecny) i platforma-usługa
- Uruchom ponownie kontroler iDRAC, a następnie odczekaj 5 minut, aż kontroler iDRAC wróci do trybu online
- Usługi uruchamiania (wymienione powyżej)
Resolution
Stan iSM jest ponownie testowany przy użyciu kontroli poprawności działania "dcism" bezpośrednio na tym węźle. Może to zgłosić inny wynik, ponieważ jest on odpytywany kilka minut po automatycznej poprawce. Jeśli wynik jest inny, test "dcism" powinien być postrzegany jako dokładniejszy wynik dla statusu iSM.
Wyniki poleceń uruchamiania usług można znaleźć w vxv.log (patrz artykuł 66460: Podręcznik rozwiązywania problemów VxVerify ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Jeśli problem iSM nie może zostać naprawiony zgodnie z powyższymi krokami, które kontrola poprawności działania może uruchomić automatycznie, zapoznaj się z artykułem: Dell VxRail: Kontrola poprawności działania węzła kończy się niepowodzeniem dla testu „dcism”
Additional Information
Wymuszenie użycia ism_fix (ponowne uruchomienie kontrolera iDRAC)
Automatyczna poprawka uruchamia się, jeśli "dcism" lub "dellism" nie są uruchomione, gdy są odpytywane z VxRM. Ma to jednak zastosowanie tylko wtedy, gdy profil testowy lub --fix argument włącza automatyczną poprawkę.
Alternatywnie można zalecić ponowne uruchomienie kontrolera iDRAC w celu rozwiązania innych problemów, aby można było włączyć automatyczną poprawkę za pośrednictwem argumentu VxVerify.
Jest to bezpieczniejszy sposób na odzyskanie komunikacji kontrolera iDRAC niż ponowne uruchomienie bezpośrednio z interfejsu użytkownika kontrolera iDRAC, ponieważ VxVerify zamknie iSM i powiązane usługi przed ponownym uruchomieniem kontrolera iDRAC, a następnie przywróci usługi we właściwej kolejności.
Argument override może żądać rozłożonego ponownego uruchomienia kontrolera iDRAC we wszystkich węzłach lub listy określonych węzłów.
Aby zastosować poprawkę do węzłów (nawet jeśli iSM działa normalnie), co spowoduje ponowne uruchomienie kontrolera iDRAC i powiązanych usług:
-
Możesz też wymusić procedurę ponownego uruchamiania iSM i iDRAC ("ism_fix") do wszystkich węzłów:
./vxverify.sh -a ism_fix=all
-
Lub zastosuj "ism_fix" do określonych węzłów na liście (bez spacji) (będą działać krótkie lub w pełni kwalifikowane nazwy):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Powyższe przykłady pokazują metody Shell i Python uruchamiania VxVerify, ale argumenty będą działać z obiema składniami.
Argument -a (--additional-params) pozwala na podanie nieograniczonej liczby par argumentów, więc musi występować po wszystkich innych standardowych argumentach, takich jak --verbose
Gdy ten argument jest używany, przesłonięcie można zobaczyć w vxv.log w następujący sposób:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all