Dell VxRail: Asegúrese de que las VM de vCLS se eliminen antes del apagado del clúster de VxRail

Resumen: Asegúrese de que las VM de vCLS se eliminen antes de la operación de apagado del clúster de VxRail.

Este artículo se aplica a: Este artículo no se aplica a: Este artículo no está vinculado a ningún producto específico. En este artículo no se identifican todas las versiones de los productos.

Síntomas

Realice el apagado del clúster de VxRail desde la interfaz de usuario del plug-in de VxRail.

Debido a una rara HostCommunication error de vCenter a ESXi, después del encendido del clúster, algunas máquinas virtuales (VM) pueden perder objetos de vSAN.
Check ESXi eam.log

// vCLS(1) = vm-3001 = agent-id 0052042f-8680-404e-9a14-46074251809d
// EAM successfully powered off the vCLS VM
2021-12-15T01:06:55.837Z |  INFO | vim-inv-update | VirtualMachinePropertyChangeHandler.java | 264 | VM: vm-3001 power state set to poweredOff
2021-12-15T01:06:56.375Z |  INFO | cluster-agent-2 | AuditedJob.java | 106 | JOB COMPLETED: [#172504658] PowerOffVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))
// then EAM tried to delete the vCLS VM
2021-12-15T01:06:56.375Z |  INFO | cluster-agent-2 | ExecutorUtils.java | 36 | JOB SUBMITED: [#1300404265] DeleteVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))
2021-12-15T01:06:56.375Z |  INFO | cluster-agent-2 | AuditedJob.java | 106 | JOB STARTED: [#1300404265] DeleteVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))

// but due to HostCommunication error, EAM failed to delete the vCLS VM.
2021-12-15T01:07:50.530Z |  WARN | cluster-agent-2 | Retry.java | 103 | Failed to delete ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null') VM vm-3001.at attempt 1 out of 24 Reason: vmodl.fault.HostCommunication {
}

// then Cluster was shutdown
// After Cluster power up EAM tried to delete the VM again after vCenter boot up, but it deleted wrong VM
2021-12-15T06:25:56.336Z |  INFO | cluster-agent-3 | ExecutorUtils.java | 36 | JOB SUBMITED: [#1489285519] DeleteVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))
2021-12-15T06:25:56.336Z |  INFO | cluster-agent-3 | AuditedJob.java | 106 | JOB STARTED: [#1489285519] DeleteVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))
2021-12-15T06:25:58.389Z |  INFO | cluster-agent-3 | AuditedJob.java | 106 | JOB COMPLETED: [#1489285519] DeleteVmJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))
2021-12-15T06:25:58.389Z |  INFO | cluster-agent-3 | AuditedJob.java | 106 | JOB COMPLETED: [#1090355414] UninstallClusterAgentJob(ClusterAgent(ID: 'Agent:0052042f-8680-404e-9a14-46074251809d:null'))

Causa

Durante el proceso de apagado del clúster de VxRail, VxRail inicia el modo de retiro del clúster, que solicita al servicio vCenter ESXi Agent Manager (EAM) que elimine las VM de vCLS. Debido a una rara HostCommunication error de vCenter a ESXi, es posible que el EAM no pueda eliminar las VM de vCLS.

VxRail Manager no puede detectar el estado de la VM de vCLS, por lo que el proceso de apagado no espera a que se complete la eliminación de la VM de vCLS. Puede apagar las VM de vCenter y VxRail Manager antes de que el EAM finalice la operación de eliminación.

Como resultado, el EAM intenta eliminar estas VM nuevamente durante el encendido del clúster, pero ahora el ID de VM entre VPXD y VPXA no está sincronizado, lo que hace que se eliminen VM incorrectas.

Resolución

Proceso de apagado del clúster mejorado de VxRail en la versión 7.0.370 para monitorear el estado de las VM de vCLS y asegurarse de que se eliminen antes de continuar con el proceso de apagado del clúster. Si el clúster se encuentra en 7.0.370 o una versión posterior, este problema ya se solucionó.

Para los clústeres anteriores a la versión 7.0.370, ANTES de realizar la operación de apagado del clúster de VxRail, es necesario asegurarse manualmente de que todas las VM de vCLS se hayan eliminado del clúster.
  1. Siga el artículo de la base de conocimientos de VMware 80472Este hipervínculo lo redirige a un sitio web fuera de Dell Technologies. "Pasos del modo de retirada" para habilitar el modo de retirada y asegurarse de que las VM de vCLS se eliminen correctamente. Esto se puede comprobar seleccionando la pestaña vSAN Cluster>VMs; no debe aparecer ninguna VM de vCLS en la lista.
Modo de retirada Configuración avanzada de vCenter Server
  1. Siga la interfaz de usuario del plug-in de VxRail para realizar el apagado del clúster.

Productos afectados

VxRail Software
Propiedades del artículo
Número de artículo: 000196884
Tipo de artículo: Solution
Última modificación: 03 feb 2025
Versión:  11
Encuentra las respuestas que necesitas con la ayuda de otros usuarios de Dell
Servicios de asistencia
Comprueba si tu dispositivo está cubierto por los servicios de asistencia.