PowerStore: La evaluación del estado del sistema falla debido al error de comunicación "No se puede realizar la evaluación del estado debido a un error de comunicación"
Summary: Después de instalar el paquete PowerStore-health_check-4.0.1.0-2416779-retail.tgz.bin, la evaluación del estado del sistema falla varios pasos con el error "No se puede realizar la evaluación del estado debido a un error de comunicación". La ruta de control (CP) también puede verse afectada debido a una carga alta de CPU0. ...
Symptoms
Después de instalar el paquete PowerStore-health_check-4.0.1.0-2416779-retail.tgz.bin, la evaluación del estado del sistema falla varias comprobaciones con el error "Unable to perform health check due to communication error."

En los detalles de la interfaz de usuario, también se puede mostrar que falló el comando fireman de comprobación del estado del sistema (0xE0F010200004).

Debido a la alta carga de CPU0, la ruta de control (CP) y otras funciones de administración también pueden verse afectadas.
Cause
El servicio cyc.bsc_status_check_service.service no se reinicia durante la instalación del paquete de PowerStore-health_check-4.0.1.0-2416779-retail.tgz.bin. Esto da como resultado una carga alta de CPU0, lo que hace que la evaluación del estado del sistema falle en varias comprobaciones con el error "Unable to perform health check due to communication error" debido a que se superaron los valores de tiempo de espera agotado.
Resolution
Solución alternativa:
Reiniciar cada nodo uno a la vez mediante el comando svc_node reboot solucionará el problema y permitirá que se apruebe la evaluación del estado del sistema. Se recomienda reiniciar primero el nodo par (no primario) y luego el nodo primario. Es importante verificar que el primer nodo esté completamente activo y en funcionamiento antes de reiniciar el segundo nodo. El comando svc_diag list --basic se puede utilizar para identificar qué nodo es el primario.
===================== Nodes ======================
id: N1
name: WK-A1234-appliance-1-node-A
slot: 0
appliance_id: A1
is_primary: False
id: N2
name: WK-A1234-appliance-1-node-B
slot: 1
appliance_id: A1
is_primary: True
El soporte técnico de Dell puede emitir un comando de nivel raíz para reiniciar el servicio cyc.bsc_status_check_service.service si reiniciar los nodos uno a la vez no es una solución alternativa viable. Escale al soporte técnico de Dell y consulte este artículo de la base de conocimientos para obtener ayuda.
Corregir:
Este problema se resolvió en el paquete de PowerStore-health_check-4.0.1.0-2424376-retail.tgz.bin.