PowerStore: La asignación de un volumen NVMeoF puede provocar la interrupción del servicio en clústeres de varios dispositivos

Summary: La asignación de volúmenes de NVMeoF en un clúster de varios dispositivos puede provocar la interrupción del servicio para el dispositivo en el que se crea el volumen.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

La asignación de volúmenes de NVMeoF en un clúster de varios dispositivos puede provocar la interrupción del servicio para el dispositivo en el que se crea el volumen. Esto puede ocurrir solo en el aparato #2 y superior. Esto no sucede en el primer dispositivo.

 

Entorno:

  • Clúster de múltiples dispositivos
  • Los hosts se conectan a través de NVMe/FC o NVMe/TCP.
  • Hubo (a) múltiples fallas de adición de dispositivos o (b) múltiples eliminaciones de dispositivos.

 

Indicios:

  • El nodo puede reiniciarse inesperadamente.
  • Si ambos nodos se reinician, puede producirse una interrupción del servicio.

 

Cause

  • En NVMeoF (NVMe/FC o NVMe/TCP), existe un mecanismo básico para admitir el acceso asimétrico al espacio de nombres (ANA).
    ANA se produce en dispositivos donde las características de acceso al volumen pueden ser diferentes entre las controladoras NVMe.
    Ejemplo: El volumen 1 en el nodo A se puede optimizar, mientras que el volumen 1 en el nodo B no está optimizado.
  • El concepto es similar a ALUA con el grupo de puertos de destino (TPG):
    A cada nodo se le asigna un ID de TPG único para distinguir entre los estados de cada nodo (optimizado y no optimizado)
  • Con NVMe-oF en PowerStore, cada dispositivo tiene varios grupos de ANA:
    • Grupo #1 de ANA: se utiliza para la migración de volúmenes entre dispositivos (el ID de grupo es 1 en todo el clúster)
    • Grupo #X de ANA: se utiliza para describir volúmenes en los que el nodo A está optimizado y el nodo B no lo está
    • Grupo #Y de ANA: se utiliza para describir volúmenes en los que el nodo A no está optimizado y el nodo B sí lo está
    • Grupo #Z de ANA (uso futuro): se utiliza para describir volúmenes en los que los nodos A y B están optimizados (activo/activo)
  • Cuando se agrega un dispositivo, Control-Path utiliza un número de secuencia especial para determinar el ID del grupo de puertos de destino que se creará.
    Esta secuencia solo aumenta, incluso cuando falla el dispositivo agregado. La secuencia puede ser bastante grande si el dispositivo agregado falla varias veces.
  • Debido a un problema de software, hay un límite en el ID máximo de grupo de ANA, mientras que Control-Path no tiene límite.
  • Cuando se asigna un volumen a un host NVMe, el volumen se clasifica en el grupo de ANA correcto; el grupo de ANA se deriva del ID de TPG del nodo propietario del volumen.
  • La operación de mapeo puede provocar una falla en el módulo de software que puede provocar un reinicio del nodo

 

Resolution

Este problema se resolvió en PowerStoreOS 4.0.0.

 

Solución alternativa

  • Escale a los servicios globales para obtener ayuda y, después de la recuperación, planifique la actualización a PowerStoreOS 4.0.0. Consulte este artículo de la base de conocimientos para obtener una atención rápida.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.