Dell VxRail: 상태 점검 'ism_fix' 또는 'rac_fix'로 iSM 및 iDRAC 문제 해결

Summary: VxRail Manager의 VxVerify는 iDRAC 및 관련 VxRail 노드 서비스를 재시작하여 iDRAC 및 iSM 장애를 수정할 수 있습니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

VxRail Manager의 VxVerify는 iDRAC 및 관련 VxRail 노드 서비스를 재시작하여 iDRAC 및 iSM 장애를 수정할 수 있습니다.
VxVerify 미니언을 사용하여 각 노드에서 직접 테스트를 실행하기 전에 VxRail Manager 기반 VxVerify는 먼저 Dell iSM(dcism 또는 dellism)을 쿼리합니다.
또는 상태 점검을 실행할 때 iDRAC 문제가 발견되면 상태 점검을 다시 시도하기 전에 이 자동 수정을 시도합니다.
자동 수정 옵션이 활성화된 경우(테스트 프로필 또는 --fix 인수 사용) 이를 수정하는 데 약 10분이 걸립니다.

이 자동 수정 결과는 다음 중 하나로 나열됩니다.
테스트 결과
결과 코드
    결과 해석
합격
0
iSM 상태 수정이 불필요하거나 테스트 프로필에서 활성화되지 않았습니다.
경고
1
재시작 후 Dell iSM 상태가 올바르게 실행되고 있었습니다.
Failure 2
Dell iSM 및 iDRAC이 재시작되었지만 iSM이 그 후에도 여전히 올바르게 실행되지 않았습니다.
위험 3
이 테스트에는 중요한 결과가 없습니다.
이 수정 사항은 VxVerify 검사가 실행된 후 iDRAC 쿼리가 실패할 경우 트리거될 수도 있습니다. 이 경우 VxVerify 미니언은 수정 후 두 번째로 실행됩니다. 테스트를 반복하여 iSM 및 iDRAC 문제가 해결되었는지 확인합니다.
통과한 각 테스트는 읽기 쉽도록 요약 보고서에 나열되지 않습니다.
상태 점검 출력의 예는 다음과 같습니다.
#========================#======#=========#====================================================================#==============#
|  Hostname / Category   |Status  Dell_KB |  Warnings or Failures, unless tests Passed                         ; Product S.N. |
#========================#======#=========#====================================================================#==============#
| _cluster               | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local                .|
|   ``                   | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local                                  |

'ism_fix' 작업은 미니언보다 먼저 실행되며 수정 명령은 SSH를 사용하여 VxRM에서 원격으로 실행됩니다. 예:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372.
In case of program errors consult article https://www.dell.com/support/kbdoc/000066460.
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local
Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local
Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local
Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] 
... 
Step 1: Starting iSM on lab-08-esxi-01.lab.local
Step 1: Starting iSM on lab-08-esxi-02.lab.local
Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
...
Step 1: Starting Platform service on lab-08-esxi-01.lab.local
Step 1: Starting Platform service on lab-08-esxi-02.lab.local
Autofix는 minion_run 이벤트 전에 vxv.log에서도 볼 수 있습니다.
2022-11-11 09:51:26-INFO     [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local
2022-11-11 09:51:31-INFO     [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green
2022-11-11 09:51:32-INFO     [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _
...
2022-11-11 09:58:58-INFO     [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']

Cause

DCISM이 실행 중이지 않은 문제를 해결하려면 테스트 프로파일에서 이 자동 문제 해결 기능이 활성화된 경우 VxVerify에서 다음 단계를 수행합니다.
  • 중지 서비스: sfcbd, dcism, PTAgent(있는 경우) 및 플랫폼 서비스
  • iDRAC를 재시작한 다음 iDRAC가 다시 온라인 상태가 될 때까지 5분간 기다립니다
  • 서비스 시작(위에 나열됨)

Resolution

iSM용 Autofix는 VxVerify에서 원격으로 폴링할 때 dcism 또는 dellism 상태에 따라 성공 또는 실패를 보고합니다. 그러면 미니언이 정상적으로 시작됩니다.
iSM 상태는 해당 노드에서 직접 'dcism' 상태 점검을 사용하여 다시 테스트됩니다. Autofix 후 몇 분 후에 폴링되기 때문에 다른 결과를 보고할 수 있습니다. 결과가 다를 경우 'dcism' 테스트가 iSM 상태에 대한 더 정확한 결과로 간주되어야 합니다.

서비스를 시작하는 명령의 결과는 vxv.log에서 확인할 수 있습니다(문서 66460: VxVerify 문제 해결 가이드 ).
2022-11-25 09:16:26-DEBUG    [ism_fix] node-04.lab.local iSM start: _
2022-11-25 09:18:26-DEBUG    [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started.
2022-11-25 09:18:26-INFO     [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local']
2022-11-25 09:18:26-INFO     [ism_check] Querying DC or Dell ISM status on host
2022-11-25 09:18:26-INFO     [ism_check] iSM status on node-04.lab.local : iSM is active (running)

상태 점검이 자동으로 실행될 수 있는 위의 단계로 iSM을 수정할 수 없는 경우 다음 문서를 참조하십시오. Dell VxRail: 'dcism' 테스트에 대한 노드 상태 점검 실패

Additional Information

ism_fix 강제 사용(iDRAC 재시작)

VxRM에서 쿼리할 때 dcism 또는 dellism 이 실행되고 있지 않으면 Autofix가 실행됩니다. 그러나 이는 테스트 프로필 또는 --fix 인수가 자동 수정을 사용하도록 설정한 경우에만 적용됩니다.
또는 다른 문제를 해결하기 위해 iDRAC를 재시작하는 것이 권장될 수 있으므로 VxVerify 인수를 통해 자동 수정을 활성화할 수 있습니다. 
이는 iDRAC UI에서 직접 재시작하는 것보다 iDRAC 통신을 복구하는 더 안전한 방법입니다. VxVerify는 iDRAC를 재시작하기 전에 iSM 및 관련 서비스를 종료한 다음 서비스를 올바른 순서로 다시 실행하기 때문입니다.
override 인수는 모든 노드에 iDRAC가 시차를 두고 다시 시작하도록 요청하거나 특정 노드 목록을 요청할 수 있습니다.

노드에 수정 사항을 적용하려면(iSM이 정상적으로 실행 중인 경우에도) iDRAC 및 관련 서비스를 재시작합니다.

  • 또는 iSM 및 iDRAC 재시작 절차('ism_fix')를 모든 노드에 강제로 적용합니다.

./vxverify.sh -a ism_fix=all​​​
  • 또는 목록의 지정된 노드 (공백 없음)에 'ism_fix'를 적용합니다(짧은 이름 또는 정규화된 이름이 작동함).

python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02

위의 예에서는 VxVerify를 실행하는 셸 및 Python 방법을 보여 주지만 인수는 두 구문 중 하나에서 작동합니다.
-a 인수(--additional-params)를 사용하면 인수 쌍을 무제한으로 지정할 수 있으므로 --verbose와 같은 다른 모든 표준 인수 뒤에 와야 합니다

이 인수를 사용하면 다음과 같이 vxv.log에서 재정의를 볼 수 있습니다.

INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local
or 
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all 

Affected Products

VxRail, iDRAC Service Module, VxRail Appliance Family, VxRail Appliance Series, VxRail Software
Article Properties
Article Number: 000205179
Article Type: Solution
Last Modified: 18 Dec 2024
Version:  12
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.