PowerStore: La asignación de un volumen NVMeoF puede provocar la interrupción del servicio en clústeres de varios dispositivos
Resumen: La asignación de volúmenes de NVMeoF en un clúster de varios dispositivos puede provocar la interrupción del servicio para el dispositivo en el que se crea el volumen.
Este artículo se aplica a
Este artículo no se aplica a
Este artículo no está vinculado a ningún producto específico.
No se identifican todas las versiones del producto en este artículo.
Síntomas
La asignación de volúmenes de NVMeoF en un clúster de varios dispositivos puede provocar la interrupción del servicio para el dispositivo en el que se crea el volumen. Esto puede ocurrir solo en el aparato #2 y superior. Esto no sucede en el primer dispositivo.
Entorno:
- Clúster de múltiples dispositivos
- Los hosts se conectan a través de NVMe/FC o NVMe/TCP.
- Hubo (a) múltiples fallas de adición de dispositivos o (b) múltiples eliminaciones de dispositivos.
Indicios:
- El nodo puede reiniciarse inesperadamente.
- Si ambos nodos se reinician, puede producirse una interrupción del servicio.
Causa
- En NVMeoF (NVMe/FC o NVMe/TCP), existe un mecanismo básico para admitir el acceso asimétrico al espacio de nombres (ANA).
ANA se produce en dispositivos donde las características de acceso al volumen pueden ser diferentes entre las controladoras NVMe.
Ejemplo: El volumen 1 en el nodo A se puede optimizar, mientras que el volumen 1 en el nodo B no está optimizado. - El concepto es similar a ALUA con el grupo de puertos de destino (TPG):
A cada nodo se le asigna un ID de TPG único para distinguir entre los estados de cada nodo (optimizado y no optimizado) - Con NVMe-oF en PowerStore, cada dispositivo tiene varios grupos de ANA:
- Grupo #1 de ANA: se utiliza para la migración de volúmenes entre dispositivos (el ID de grupo es 1 en todo el clúster)
- Grupo #X de ANA: se utiliza para describir volúmenes en los que el nodo A está optimizado y el nodo B no lo está
- Grupo #Y de ANA: se utiliza para describir volúmenes en los que el nodo A no está optimizado y el nodo B sí lo está
- Grupo #Z de ANA (uso futuro): se utiliza para describir volúmenes en los que los nodos A y B están optimizados (activo/activo)
- Cuando se agrega un dispositivo, Control-Path utiliza un número de secuencia especial para determinar el ID del grupo de puertos de destino que se creará.
Esta secuencia solo aumenta, incluso cuando falla el dispositivo agregado. La secuencia puede ser bastante grande si el dispositivo agregado falla varias veces. - Debido a un problema de software, hay un límite en el ID máximo de grupo de ANA, mientras que Control-Path no tiene límite.
- Cuando se asigna un volumen a un host NVMe, el volumen se clasifica en el grupo de ANA correcto; el grupo de ANA se deriva del ID de TPG del nodo propietario del volumen.
- La operación de mapeo puede provocar una falla en el módulo de software que puede provocar un reinicio del nodo
Resolución
Este problema se resolvió en PowerStoreOS 4.0.0.
Solución alternativa
- Escale a los servicios globales para obtener ayuda y, después de la recuperación, planifique la actualización a PowerStoreOS 4.0.0. Consulte este artículo de la base de conocimientos para obtener una atención rápida.
Productos afectados
PowerStorePropiedades del artículo
Número del artículo: 000216639
Tipo de artículo: Solution
Última modificación: 28 may 2024
Versión: 3
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.