Serie VNX1: La conmutación por error del administrador de transferencia de datos de VNX no se producía después de una falla de hardware de CS
Summary: Serie VNX1: La conmutación por error del administrador de transferencia de datos de VNX no se producía después de una falla de hardware de CS (corregible por el usuario)
Symptoms
Falla de hardware en un arreglo de control station único
Se produjo una falla de VNX Control Station y, antes de reemplazar el hardware, se produjo una falla que normalmente debería haber desencadenado una conmutación por error del administrador de transferencia de datos, pero no se produjo ninguna conmutación por error del administrador de transferencia de datos.
Cause
En un arreglo con un solo control station, cuando se produce una falla de hardware en Control Station que provoca que no se pueda iniciar o que no se puedan ejecutar correctamente los servicios de Control Station NAS para la administración del arreglo, cualquier evento posterior que normalmente desencadenaría una conmutación por error del administrador de transferencia de datos no lo hará. El control station NAS y sus servicios de administración son necesarios para realizar una conmutación por error del administrador de transferencia de datos. Una Control Station que no funciona o que tiene los servicios NAS en un estado detenido no puede desencadenar una conmutación por error del administrador de transferencia de datos.
En una configuración de Control Station doble, una falla de los servicios o el hardware de la Control Station primaria provocará que la Control Station par en espera asuma a la fuerza el rol como la Control Station principal, esto se activa cuando la Control Station par no recibe respuestas a los latidos de la administración o las respuestas de latidos superan un valor de tiempo de espera agotado.
Resolution
Para una Control Station que está en línea, ejecute el comando "nas_checkup" para confirmar si se informaron fallas de hardware o de software. Si hay fallas de hardware, se debe recurrir al soporte de VNX para resolverlas. Es posible que sea posible resolver una advertencia para un problema de software mediante el https://support.emc.com/ de la base de conocimientos de Dell
Siempre ejecute y recopile material de soporte en Control Station, si es posible, para capturar los registros y el estado actual antes de cambiarlos, de modo que se puedan analizar si es necesario.
Para comprobar específicamente si hay una falla de hardware, solo se pueden utilizar los siguientes comandos. Para el estado del gabinete, se especifica el número de gabinete del administrador de transferencia de datos después de (-e)
$ nas_inventory -tree
$ /nas/sbin/enclosure_status -e 0 -v
Additional Information
Más referencias:
A continuación, se indica el procedimiento para generar este archivo zip de diagnóstico en VNX Control Station:
[Recolectar materiales de apoyo]
-
Para generar una recopilación de materiales de soporte (paquete de diagnóstico) desde el NAS de VNX, ejecute el siguiente script en Control Station cuando se conecte a través de SSH e inicie sesión como nasadmin.
$ /nas/tools/collect_support_materials
-
Cuando se completa el script, se genera un archivo Zip y el nombre y la ubicación de este archivo se muestran en la pantalla
-
Se necesita un cliente SCP como Winscp para descargar el archivo desde Control Station a su estación de trabajo. La ubicación predeterminada en Control Station para la recopilación de materiales de soporte que se generarán es /nas/var/emcsupport.
Nota: Los materiales de soporte recopilados más antiguos se eliminarán automáticamente para liberar espacio si es necesario en /nas/var/emcsupport.
Celerra: Cómo aumentar el valor de tiempo de espera agotado de conmutación por error de Control Station.
https://support.emc.com/kb/331802 (se requiere una cuenta de soporte de Dell para ver este artículo)
El procedimiento de conmutación por error del administrador de transferencia de datos en archivos de Celerra y VNX (se requiere una cuenta de soporte de Dell para ver este artículo)