Dell VxRail: iSM ve iDRAC sorunlarını düzelten "ism_fix" veya "rac_fix" sağlık kontrolü
Summary: VxRail Manager'daki VxVerify, iDRAC ve ilgili VxRail düğüm hizmetlerini yeniden başlatarak iDRAC ve iSM arızasını düzeltmeyi deneyebilir.
Symptoms
VxRail Manager'daki VxVerify, testleri doğrudan her düğümde çalıştırmadan önce VxVerify minion'u kullanarak ilk olarak Dell iSM'yi (dcism veya dellism) sorgular.
Alternatif olarak, sağlık kontrolleri çalıştırılırken iDRAC sorunları bulunursa, sağlık kontrolleri yeniden denenmeden önce bu Otomatik Düzeltme denenir.
Otomatik Düzelt seçeneği etkinleştirilirse (test profili veya --fix bağımsız değişkeni ile), bunu düzeltme girişimi yaklaşık 10 dakika sürer.
Bu otomatik düzeltmenin sonucu aşağıdakilerden biri olarak listelenir:
|
Test Sonucu
|
Sonuç kodu
|
Sonuç Yorumlama
|
|
Sorun Yok
|
0
|
iSM durumunun düzeltilmesi gereksizdi veya test profili altında etkinleştirilmemişti.
|
|
Uyarı
|
1
|
Yeniden başlatmanın ardından Dell iSM durumu doğru şekilde çalışıyordu. |
| Başarısız | 2 |
Dell iSM ve iDRAC yeniden başlatıldı ancak iSM sonrasında hala doğru şekilde çalışmıyordu.
|
| Critical (Önemli) | 3 |
Bu testin kritik bir sonucu yoktur.
|
Başarılı olan her test, okuma kolaylığı için özet raporunda listelenmez.
Durum kontrolü çıktısının bir örneği aşağıda gösterilmiştir:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |'ism_fix' işlemi minionlardan önce çalışır ve düzeltme komutları SSH kullanılarak VxRM'den uzaktan çalıştırılır. Örneğin:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localOtomatik Düzeltme, minion_run olaylarından önceki vxv.log de görülebilir:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- Stop hizmetleri: sfcbd, dcism, PTAgent (varsa) ve Platform hizmeti
- iDRAC ı yeniden başlatın, ardından iDRAC'ın tekrar çevrimiçi olması için 5 dakika bekleyin
- Hizmetleri başlatma (yukarıda listelenmiştir)
Resolution
iSM durumu, doğrudan bu düğümde "dcism" sağlık kontrolü kullanılarak yeniden test edilir. Bu, farklı bir sonuç bildirebilir, çünkü bu, Otomatik Düzeltme'den birkaç dakika sonra yoklanır. Sonuç farklıysa, 'dcism' testi iSM'nin durumu için daha doğru sonuç olarak görülmelidir.
Hizmetleri başlatma komutlarının sonuçları vxv.log bulunabilir (bkz . makale 66460: VxVerify Sorun Giderme Kılavuzu ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
Sağlık kontrolünün otomatik olarak çalıştırabileceği iSM, yukarıdaki adımlarla düzeltilemezse şu makaleye bakın: Dell VxRail: Düğüm sağlık kontrolü "dcism" testinde başarısız oluyor
Additional Information
ism_fix kullanımını zorlama (iDRAC yeniden başlatma)
Otomatik düzeltme, VxRM'den sorgulandığında "dcism" veya "dellism" çalışmıyorsa çalışır. Ancak, bu yalnızca test profili veya --fix bağımsız değişkeni Otomatik Düzeltme'yi etkinleştirdiğinde geçerlidir.
Alternatif olarak, diğer sorunları ele almak için iDRAC'ın yeniden başlatılması önerilebilir ve böylece Otomatik Düzeltme bir VxVerify bağımsız değişkeni üzerinden etkinleştirilebilir.
Bu, iDRAC iletişimini kurtarmak için doğrudan iDRAC kullanıcı arayüzünden yeniden başlatmaktan daha güvenli bir yöntemdir çünkü VxVerify, iDRAC'i yeniden başlatmadan önce iSM'yi ve ilgili hizmetleri kapatır ve daha sonra hizmetleri doğru sırada yeniden getirir.
Geçersiz kılma bağımsız değişkeni, tüm düğümlerin iDRAC'ın kademeli olarak yeniden başlatılmasını veya belirli düğümlerin listesini isteyebilir.
Düzeltmeyi, iDRAC ve ilgili hizmetleri yeniden başlatacak düğümlere (iSM normal çalışıyor olsa bile) uygulamak için:
-
Tüm düğümlere zorla iSM ve iDRAC yeniden başlatma prosedürü ("ism_fix") uygulayın:
./vxverify.sh -a ism_fix=all
-
Alternatif olarak, bir listede belirtilen düğümlere (boşluk olmadan) 'ism_fix' uygulayın (kısa veya tam nitelikli adlar çalışır):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
Yukarıdaki örneklerde VxVerify ı çalıştırmak için Shell ve Python yöntemleri gösterilmektedir ancak bağımsız değişkenler her iki söz dizimiyle de çalışır.
-a bağımsız değişkeni (--additional-params), sınırsız sayıda bağımsız değişken çiftinin belirtilmesine izin verir, bu nedenle --verbose gibi diğer tüm standart bağımsız değişkenlerden sonra gelmelidir
Bu bağımsız değişken kullanıldığında, geçersiz kılma vxv.log aşağıdaki gibi görülebilir:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all