Dell VxRail: 상태 점검 'ism_fix' 또는 'rac_fix'로 iSM 및 iDRAC 문제 해결
Summary: VxRail Manager의 VxVerify는 iDRAC 및 관련 VxRail 노드 서비스를 재시작하여 iDRAC 및 iSM 장애를 수정할 수 있습니다.
Symptoms
VxVerify 미니언을 사용하여 각 노드에서 직접 테스트를 실행하기 전에 VxRail Manager 기반 VxVerify는 먼저 Dell iSM(dcism 또는 dellism)을 쿼리합니다.
또는 상태 점검을 실행할 때 iDRAC 문제가 발견되면 상태 점검을 다시 시도하기 전에 이 자동 수정을 시도합니다.
자동 수정 옵션이 활성화된 경우(테스트 프로필 또는 --fix 인수 사용) 이를 수정하는 데 약 10분이 걸립니다.
이 자동 수정 결과는 다음 중 하나로 나열됩니다.
|
테스트 결과
|
결과 코드
|
결과 해석
|
|
합격
|
0
|
iSM 상태 수정이 불필요하거나 테스트 프로필에서 활성화되지 않았습니다.
|
|
경고
|
1
|
재시작 후 Dell iSM 상태가 올바르게 실행되고 있었습니다. |
| Failure | 2 |
Dell iSM 및 iDRAC이 재시작되었지만 iSM이 그 후에도 여전히 올바르게 실행되지 않았습니다.
|
| 위험 | 3 |
이 테스트에는 중요한 결과가 없습니다.
|
통과한 각 테스트는 읽기 쉽도록 요약 보고서에 나열되지 않습니다.
상태 점검 출력의 예는 다음과 같습니다.
#========================#======#=========#====================================================================#==============# | Hostname / Category |Status Dell_KB | Warnings or Failures, unless tests Passed ; Product S.N. | #========================#======#=========#====================================================================#==============# | _cluster | Warning 205179 | ism_fix: iSM and iDRAC fixed for node1.lab.local, node4.lab.local .| | `` | Warning 205179 | rac_fix: iSM and iDRAC fixed for node2.lab.local |'ism_fix' 작업은 미니언보다 먼저 실행되며 수정 명령은 SSH를 사용하여 VxRM에서 원격으로 실행됩니다. 예:
Running VxVerify 3.21.108, pre-upgrade healthcheck on VxRail 7.0.372. In case of program errors consult article https://www.dell.com/support/kbdoc/000066460. Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-01.lab.local Step 1: Fixing iSM issue, prior to running health-checks, on node: lab-08-esxi-02.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-01.lab.local Step 1: Stopping ISM and platform service on lab-08-esxi-02.lab.local Step 1: Pausing for 266 seconds more after iDRAC restarted on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting iSM on lab-08-esxi-01.lab.local Step 1: Starting iSM on lab-08-esxi-02.lab.local Step 1: Pausing for 84 seconds more after Dell iSM started on ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local'] ... Step 1: Starting Platform service on lab-08-esxi-01.lab.local Step 1: Starting Platform service on lab-08-esxi-02.lab.localAutofix는 minion_run 이벤트 전에 vxv.log에서도 볼 수 있습니다.
2022-11-11 09:51:26-INFO [ism_fix] Fixing phase 1 Dell ISM on node on lab-08-esxi-01.lab.local 2022-11-11 09:51:31-INFO [ism_fix] lab-08-esxi-01.lab.local Auto-fix continuing with vSAN objecthealth: green 2022-11-11 09:51:32-INFO [ism_fix] iDRAC restarting on lab-08-esxi-01.lab.local: _ ... 2022-11-11 09:58:58-INFO [ism_fix] Checking hosts for auto-fix success: ['lab-08-esxi-01.lab.local', 'lab-08-esxi-02.lab.local']
Cause
- 중지 서비스: sfcbd, dcism, PTAgent(있는 경우) 및 플랫폼 서비스
- iDRAC를 재시작한 다음 iDRAC가 다시 온라인 상태가 될 때까지 5분간 기다립니다
- 서비스 시작(위에 나열됨)
Resolution
iSM 상태는 해당 노드에서 직접 'dcism' 상태 점검을 사용하여 다시 테스트됩니다. Autofix 후 몇 분 후에 폴링되기 때문에 다른 결과를 보고할 수 있습니다. 결과가 다를 경우 'dcism' 테스트가 iSM 상태에 대한 더 정확한 결과로 간주되어야 합니다.
서비스를 시작하는 명령의 결과는 vxv.log에서 확인할 수 있습니다(문서 66460: VxVerify 문제 해결 가이드 ).
2022-11-25 09:16:26-DEBUG [ism_fix] node-04.lab.local iSM start: _ 2022-11-25 09:18:26-DEBUG [ism_fix] node-04.lab.local Platform service start: Starting Platform Service Daemon. Check hostd status. hostd is ready. Platform Service started. 2022-11-25 09:18:26-INFO [ism_fix] Checking hosts for auto-fix success: ['node-04.lab.local'] 2022-11-25 09:18:26-INFO [ism_check] Querying DC or Dell ISM status on host 2022-11-25 09:18:26-INFO [ism_check] iSM status on node-04.lab.local : iSM is active (running)
상태 점검이 자동으로 실행될 수 있는 위의 단계로 iSM을 수정할 수 없는 경우 다음 문서를 참조하십시오. Dell VxRail: 'dcism' 테스트에 대한 노드 상태 점검 실패
Additional Information
ism_fix 강제 사용(iDRAC 재시작)
VxRM에서 쿼리할 때 dcism 또는 dellism 이 실행되고 있지 않으면 Autofix가 실행됩니다. 그러나 이는 테스트 프로필 또는 --fix 인수가 자동 수정을 사용하도록 설정한 경우에만 적용됩니다.
또는 다른 문제를 해결하기 위해 iDRAC를 재시작하는 것이 권장될 수 있으므로 VxVerify 인수를 통해 자동 수정을 활성화할 수 있습니다.
이는 iDRAC UI에서 직접 재시작하는 것보다 iDRAC 통신을 복구하는 더 안전한 방법입니다. VxVerify는 iDRAC를 재시작하기 전에 iSM 및 관련 서비스를 종료한 다음 서비스를 올바른 순서로 다시 실행하기 때문입니다.
override 인수는 모든 노드에 iDRAC가 시차를 두고 다시 시작하도록 요청하거나 특정 노드 목록을 요청할 수 있습니다.
노드에 수정 사항을 적용하려면(iSM이 정상적으로 실행 중인 경우에도) iDRAC 및 관련 서비스를 재시작합니다.
-
또는 iSM 및 iDRAC 재시작 절차('ism_fix')를 모든 노드에 강제로 적용합니다.
./vxverify.sh -a ism_fix=all
-
또는 목록의 지정된 노드 (공백 없음)에 'ism_fix'를 적용합니다(짧은 이름 또는 정규화된 이름이 작동함).
python vxverify3.pyc <any_other_arguments> -a ism_fix=lab-08-esxi-01,lab-08-esxi-02
위의 예에서는 VxVerify를 실행하는 셸 및 Python 방법을 보여 주지만 인수는 두 구문 중 하나에서 작동합니다.
-a 인수(--additional-params)를 사용하면 인수 쌍을 무제한으로 지정할 수 있으므로 --verbose와 같은 다른 모든 표준 인수 뒤에 와야 합니다
이 인수를 사용하면 다음과 같이 vxv.log에서 재정의를 볼 수 있습니다.
INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-01, due to override argument: lab-08-esxi-01.lab.local,lab-08-esxi-02.lab.local or INFO [ism_fix] Running fix for Dell ISM on node: lab-08-esxi-02, due to override argument: all