Dell VxRail:執行狀況檢查「ism_fix」或「rac_fix」修正 iSM 和 iDRAC 問題
Summary: VxRail Manager 上的 VxVerify 可以重新開機 iDRAC 及相關的 VxRail 節點服務,藉此嘗試修正 iDRAC 和 iSM 故障。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
VxRail Manager 上的 VxVerify 可以重新開機 iDRAC 及相關的 VxRail 節點服務,藉此嘗試修正 iDRAC 和 iSM 故障。
VxRail Manager 上的 VxVerify 使用直接在每個節點上執行測試之前,會先查詢 Dell iSM (dcism 或 dellism)。
或者,如果在執行狀況檢查時發現 iDRAC 問題,則在重試執行狀況檢查前,會先嘗試此自動修正。
如果啟用了自動修復選項(通過測試配置檔或使用參數 --fix),則嘗試更正此問題大約需要 10 分鐘。
此自動更正的結果列為以下結果之一:
如果 iDRAC 查詢失敗,也可以在 VxVerify 檢查執行後觸發此修正。在這種情況下,VxVerify minion 將在修正後第二次執行。重複的測試會檢查 iSM 和 iDRAC 問題是否已修正。
為了便於閱讀,每個通過的測試都不會在摘要報告中列出。
執行狀況檢查輸出的範例如下所示:
VxRail Manager 上的 VxVerify 使用直接在每個節點上執行測試之前,會先查詢 Dell iSM (dcism 或 dellism)。
或者,如果在執行狀況檢查時發現 iDRAC 問題,則在重試執行狀況檢查前,會先嘗試此自動修正。
如果啟用了自動修復選項(通過測試配置檔或使用參數 --fix),則嘗試更正此問題大約需要 10 分鐘。
此自動更正的結果列為以下結果之一:
|
測試結果
|
結果代碼
|
結果解釋
|
|
過
|
0
|
不需要修正 iSM 狀態,或是未在測試設定檔下啟用。
|
|
Warning
|
1
|
重新開機後,Dell iSM 狀態執行正確。 |
| 失敗 | 2 |
Dell iSM 和 iDRAC 已重新啟動,但 iSM 之後仍無法正常執行。
|
| 嚴重 | 3 |
此測試沒有嚴重結果。
|
為了便於閱讀,每個通過的測試都不會在摘要報告中列出。
執行狀況檢查輸出的範例如下所示:
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |「ism_fix」作業會在 minion 之前執行,修正命令則使用 SSH 從 VxRM 遠端執行。例如:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.local在minion_run事件發生之前,也可以在vxv.log中看到自動修正:
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
若要修正未執行的 dcism,如果在 測試設定檔中已啟用此自動補救功能,則由 VxVerify 執行下列步驟:
- 停止服務:sfcbd、dcism、PTAgent (若有) &; 平台服務
- 重新啟動 iDRAC,然後等待 5 分鐘,讓 iDRAC 重新連線
- 啟動服務 (如上所列)
Resolution
當 VxVerify 遠端輪詢時,iSM 的自動修正會根據「dcism」或「dellism」狀態報告其成功或失敗。然後正常啟動工作節點。
您可直接在該節點上使用「dcism」執行狀況檢查重新測試 iSM 狀態。這可能會報告不同的結果,因為這是在自動修復幾分鐘後輪詢的。如果結果確實不同,“dcism”測試應被視為iSM狀態的更準確結果。
您可以在vxv.log中找到用於啟動服務的命令的結果 (請參閱文章 66460:VxVerify 故障診斷指南)。
如果無法透過上述步驟修正 iSM,且執行狀況檢查可以自動執行,請參閱文章:Dell VxRail:節點執行狀況檢查測試「dcism」失敗
您可直接在該節點上使用「dcism」執行狀況檢查重新測試 iSM 狀態。這可能會報告不同的結果,因為這是在自動修復幾分鐘後輪詢的。如果結果確實不同,“dcism”測試應被視為iSM狀態的更準確結果。
您可以在vxv.log中找到用於啟動服務的命令的結果 (請參閱文章 66460:VxVerify 故障診斷指南)。
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
如果無法透過上述步驟修正 iSM,且執行狀況檢查可以自動執行,請參閱文章:Dell VxRail:節點執行狀況檢查測試「dcism」失敗
Additional Information
強制使用 ism_fix (iDRAC 重新開機)
從 VxRM 查詢時,如果「dcism」或「dellism」未執行,自動修正就會執行。但是,這僅適用於測試配置檔或 --fix 參數啟用自動修復。
或者,建議您重新啟動 iDRAC 以解決其他問題,並透過 VxVerify 引數啟用自動修正。
這是還原 iDRAC 通訊更安全的方式,而不是直接從 iDRAC UI 重新啟動,因為 VxVerify 會先關閉 iSM 和相關服務,然後再重新啟動 iDRAC,然後以正確的順序恢復服務。
覆寫引數可以要求所有節點交錯 iDRAC 重新開機,或是特定節點的清單。
若要套用修正至節點 (即使 iSM 正常執行),這會重新啟動 iDRAC 和相關服務:
-
任一做法,將 iSM 和 iDRAC 重新開機程序 (「ism_fix」) 套用 至所有節點:
./vxverify.sh -a ism_fix=all
-
或者,將「ism_fix」應用於 清單中的指定節點 (無空格)(可以使用短名稱或完全限定名稱):
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
以上範例顯示執行 VxVerify 的 Shell 和 Python 方法,但引數可搭配任一語法使用。
-a 參數 (--additional-params) 允許指定無限數量的參數對,因此它必須位於所有其他標準參數之後,例如 --verbose
使用此參數時,可以在vxv.log中看到覆蓋,如下所示:
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all
Affected Products
VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail SoftwareArticle Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version: 12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.