Dell VxRail: 오래된 public.operation_status 레코드로 인해 VxRail 4.7.410에서 단일 노드 종료 방지
Resumen: 단일 노드 종료에 대한 검증은 해당 작업을 표시하지 않고는 경쟁하지 않습니다.
Síntomas
VxRail 플러그인의 단일 노드 종료 요청("Monitor"->"Physical View"->"ACTIONS"->"Shutdown Host")이 "Validate" 단계에서 중지되었습니다.
3/4 ESXi 호스트는 문제 없이 다음 단계를 완료했습니다. 그러나 특정 호스트가 "Shutdown Host - hostname" 대화 상자에 일반적인 작업을 표시하지 않고 "Validate" 단계에서 중지되었습니다.
- VM 마이그레이션
- 검증
- 확인
- 종료
VxRail Manager와 ESXi 간의 모든 관련 서비스를 재시작해도 문제가 해결되지 않았습니다.
VxRail Manager를 재시작해도 문제가 해결되지 않았습니다.
ESXi 호스트를 재시작해도 문제가 해결되지 않습니다.
관리 계정에 아무런 문제가 없습니다.
로그 번들에서 오래된 public.operation_status 레코드가 발견되었습니다(SERVICE_TAG 교체해야 함).
# pwd /VxRail_Support_Bundle_528b5b3d-d2f4-2f70-fc35-d3e15c274bcc_2022-06-01_00_23_57/vxrail_data_collection_2022-06-01_00_23_57/dump # grep "^COPY " db_mysticmanager -n |grep public.operation_status -A1 3623:COPY public.operation_status (id, owner, state, error, progress, starttime, endtime, target, step, detail, extension) FROM stdin; 3695:COPY public.power_supply (sn, part_number, revision_number, name, manufacturer, slot, health, missing, appliance_id) FROM stdin; # expr 3695 - 3623 - 1 71 # grep "^COPY public.operation_status" db_mysticmanager -A71 |grep "^COPY \|HOST_SHUTDOWN[[:space:]]IN_PROGRESS"|grep SERVICE_TAG 3d56845d-32be-4b67-b5a6-f10790ccedcc HOST_SHUTDOWN IN_PROGRESS \N 0 1649927129841 \N SERVICE_TAG \N \N \N
Causa
유효하지 않은 public.operation_status 레코드로 인해 "유효성 검사" 단계가 완료되지 않습니다.
Resolución
이 문제는 오래된 public.operation_status 레코드를 삭제하여 해결되었습니다.
-
vSphere Client에서 VxRail Manager 가상 머신의 스냅샷을 생성합니다.
-
ssh를 사용하여 VxRail Manager에 mystic으로 로그인한 다음 사용자(su -)를 루트 사용자로 전환합니다.
-
다음 명령을 실행하여 VxRail Manager 데이터베이스에서 IN_PROGRESS/HOST_SHUTDOWN 작업 목록을 표시합니다.
# psql -U postgres mysticmanager -c "select id, owner, state, error, target from public.operation_status where owner='HOST_SHUTDOWN' and state='IN_PROGRESS';"
-
3단계의 출력에서 "IN_PROGRESS" 상태 작업의 "id"를 식별합니다.
-
다음 명령을 실행하여 VxRail Manager 데이터베이스에서 레코드를 삭제합니다.
# psql -U postgres mysticmanager -c "delete from public.operation_status where id='ID_FROM_PREVIOUS_PSQL_COMMAND_OUTPUT' and owner='HOST_SHUTDOWN' and state='IN_PROGRESS';"
-
다음 명령을 실행하여 VxRail Manager에서 vmware-marvin 및 run providers 서비스를 재시작합니다.
# systemctl restart vmware-marvin # systemctl restart runjars
-
VxRail 플러그인("Monitor"->"Physical View"->"ACTIONS"->"Shutdown Host")에서 단일 노드 종료를 다시 시도하고 "Validate" 단계 결과를 확인합니다.
-
"Validate" 단계가 완료되면 VxRail Manager 가상 머신의 스냅샷을 삭제할 수 있습니다.