VPLEX: Las fallas de componentes en la controladora de arreglos o fabric provocan la falta de disponibilidad de datos de rendimiento
Resumen: En este artículo, se explica cómo mitigar los problemas relacionados con la falla de un solo componente que pueden afectar el rendimiento en un entorno VPLEX.
Este artículo se aplica a:
Este artículo no se aplica a:
Este artículo no está vinculado a ningún producto específico.
En este artículo no se identifican todas las versiones de los productos.
Instrucciones
Resumen del
problemaLos usuarios finales pueden experimentar un impacto grave en algunos o todos los hosts conectados a VPLEX debido a problemas como vaciados lentos, fallas de la controladora de destino del arreglo, errores de CRC, fallas de ASIC del switch, reinicios del switch, etc. El back-end de VPLEX utiliza una política round-robin que puede causar problemas en un fabric para afectar todas las rutas de host en ese fabric (o también puede afectar las rutas en el otro fabric).
Para equipos
de switches y arreglos Si un usuario final informa un impacto generalizado como resultado de la falla de un solo componente, vaciado lento, etc., consulte con el usuario final para ver si VPLEX está en el entorno. Si VPLEX está en el entorno y se conoce el alcance del problema, solicite que el usuario final bloquee las rutas afectadas en el switch. Si VPLEX está en el entorno y no se conocen las rutas afectadas, comuníquese con el soporte al cliente de Dell EMC, explique el problema y mencione este artículo.
Para el equipo
de VPLEXSi hay una SR en la que el usuario final informa un impacto continuo y se sospecha que la causa se debe a rutas de back-end de bajo rendimiento, identifique las rutas de bajo rendimiento y bloquéelas en VPLEX. Si las rutas afectadas no son evidentes, comuníquese con un asesor para obtener ayuda. Las colaboraciones de switches y arreglos se pueden realizar una vez que haya finalizado el impacto.
Antecedentes
Flujo
de I/O de VPLEX al arregloVPLEX funciona de manera similar a un entorno de host en clúster. Cada director, que recibe I/O del host, es responsable de completar esa I/O. Cada director tiene varias rutas en ambos fabrics a cada LUN. Cada director de VPLEX es responsable de balancear las operaciones de I/O en todas las rutas activas disponibles.
Detección y mitigación
de fallas de VPLEXEl método principal que utiliza VPLEX para detectar y mitigar las fallas de ruta es monitorear la proporción de tiempos de espera agotados en cada ruta. Si se agota el tiempo de espera del 90 % de las I/O en dos períodos de 15 segundos consecutivos, VPLEX desterrará la ruta afectada y ya no la utilizará. A continuación, VPLEX sondeará periódicamente la ruta prohibida y anulará su expulsión si las operaciones de I/O se vuelven a ver correctamente en esta ruta.
Cómo pueden surgir
los problemasDebido al umbral alto para el desterramiento de rutas, el sondeo frecuente y el umbral bajo para cancelar el destierro de la ruta, VPLEX puede seguir utilizando rutas en mal estado. El resultado es que VPLEX puede enviar una cantidad significativa de I/O a través de rutas de rendimiento deficiente o rutas que han experimentado fallas leves. Esta I/O agota el tiempo de espera o tarda demasiado tiempo en completarse. El resultado son tiempos de respuesta significativamente elevados en todas las rutas de host. Esto puede provocar una falta de disponibilidad de datos de rendimiento para cualquiera o todos los hosts conectados a VPLEX.
Recomendación
Actualice a VPLEX GeoSynchrony con el código de destino 6.2 P3 o posterior para mejorar el alivio/manejo de las condiciones anteriores. Consulte las notas de la versión para obtener más detalles sobre la funcionalidad de administración de rutas de back-end.
problemaLos usuarios finales pueden experimentar un impacto grave en algunos o todos los hosts conectados a VPLEX debido a problemas como vaciados lentos, fallas de la controladora de destino del arreglo, errores de CRC, fallas de ASIC del switch, reinicios del switch, etc. El back-end de VPLEX utiliza una política round-robin que puede causar problemas en un fabric para afectar todas las rutas de host en ese fabric (o también puede afectar las rutas en el otro fabric).
Para equipos
de switches y arreglos Si un usuario final informa un impacto generalizado como resultado de la falla de un solo componente, vaciado lento, etc., consulte con el usuario final para ver si VPLEX está en el entorno. Si VPLEX está en el entorno y se conoce el alcance del problema, solicite que el usuario final bloquee las rutas afectadas en el switch. Si VPLEX está en el entorno y no se conocen las rutas afectadas, comuníquese con el soporte al cliente de Dell EMC, explique el problema y mencione este artículo.
Para el equipo
de VPLEXSi hay una SR en la que el usuario final informa un impacto continuo y se sospecha que la causa se debe a rutas de back-end de bajo rendimiento, identifique las rutas de bajo rendimiento y bloquéelas en VPLEX. Si las rutas afectadas no son evidentes, comuníquese con un asesor para obtener ayuda. Las colaboraciones de switches y arreglos se pueden realizar una vez que haya finalizado el impacto.
Antecedentes
Flujo
de I/O de VPLEX al arregloVPLEX funciona de manera similar a un entorno de host en clúster. Cada director, que recibe I/O del host, es responsable de completar esa I/O. Cada director tiene varias rutas en ambos fabrics a cada LUN. Cada director de VPLEX es responsable de balancear las operaciones de I/O en todas las rutas activas disponibles.
Detección y mitigación
de fallas de VPLEXEl método principal que utiliza VPLEX para detectar y mitigar las fallas de ruta es monitorear la proporción de tiempos de espera agotados en cada ruta. Si se agota el tiempo de espera del 90 % de las I/O en dos períodos de 15 segundos consecutivos, VPLEX desterrará la ruta afectada y ya no la utilizará. A continuación, VPLEX sondeará periódicamente la ruta prohibida y anulará su expulsión si las operaciones de I/O se vuelven a ver correctamente en esta ruta.
Cómo pueden surgir
los problemasDebido al umbral alto para el desterramiento de rutas, el sondeo frecuente y el umbral bajo para cancelar el destierro de la ruta, VPLEX puede seguir utilizando rutas en mal estado. El resultado es que VPLEX puede enviar una cantidad significativa de I/O a través de rutas de rendimiento deficiente o rutas que han experimentado fallas leves. Esta I/O agota el tiempo de espera o tarda demasiado tiempo en completarse. El resultado son tiempos de respuesta significativamente elevados en todas las rutas de host. Esto puede provocar una falta de disponibilidad de datos de rendimiento para cualquiera o todos los hosts conectados a VPLEX.
Recomendación
Actualice a VPLEX GeoSynchrony con el código de destino 6.2 P3 o posterior para mejorar el alivio/manejo de las condiciones anteriores. Consulte las notas de la versión para obtener más detalles sobre la funcionalidad de administración de rutas de back-end.
Productos afectados
VPLEX SeriesProductos
VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6Propiedades del artículo
Número de artículo: 000157795
Tipo de artículo: How To
Última modificación: 03 jun 2025
Versión: 4
Encuentra las respuestas que necesitas con la ayuda de otros usuarios de Dell
Servicios de asistencia
Comprueba si tu dispositivo está cubierto por los servicios de asistencia.