PowerStore: O mapeamento de um volume NVMeoF pode provocar a interrupção do serviço em clusters de vários appliances

Resumo: O mapeamento de volumes NVMeoF num cluster de vários appliances pode provocar a interrupção do serviço do appliance no qual o volume é criado.

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Sintomas

O mapeamento de volumes NVMeoF num cluster de vários appliances pode provocar a interrupção do serviço do appliance no qual o volume é criado. Isto pode ocorrer apenas no appliance#2 e superior. Isso não ocorre no primeiro aparelho.

 

Ambiente:

  • Cluster de vários appliances
  • Os anfitriões estão ligados através de NVMe/FC ou NVMe/TCP.
  • Houve (a) várias falhas de adição de appliances ou (b) várias remoções de appliances realizadas.

 

Sintomas:

  • O nó pode reiniciar inesperadamente.
  • Se ambos os nós reiniciarem, pode ocorrer uma interrupção do serviço.

 

Causa

  • No NVMeoF (NVMe/FC ou NVMe/TCP), existe um mecanismo básico para suportar o acesso assimétrico ao namespace (ANA)
    ANA ocorre em dispositivos onde as características de acesso ao volume podem ser diferentes entre controladores NVMe.
    Exemplo: O Volume-1 no Nó-A pode ser otimizado, enquanto o Volume-1 no Nó-B não está otimizado.
  • O conceito é semelhante ao ALUA com Target Port Group (TPG):
    A cada nó é atribuído um ID TPG exclusivo para distinguir entre os estados de cada nó (o que está otimizado e o que não está otimizado)
  • Com o NVMe-oF no PowerStore, cada appliance tem vários grupos de ANA:
    • Grupo ANA #1 - Usado para migração de volume entre appliances (o ID do grupo é 1 em todo o cluster)
    • #X do Grupo ANA — Utilizado para descrever volumes em que o Nó A está otimizado e o Nó B não está otimizado
    • #Y do Grupo ANA — Utilizado para descrever volumes em que o Nó A não está otimizado e o Nó B está otimizado
    • ANA Group #Z (Utilização Futura) – Utilizada para descrever volumes em que o Nó A e o Nó B estão otimizados (Ativo/Ativo)
  • Ao adicionar um appliance, o Control-Path utiliza um número de sequência especial para determinar a ID do grupo de portas de destino a criar.
    Esta sequência só aumenta, mesmo quando o appliance adicionado falha. A sequência pode ser bastante grande se o appliance adicionado falhar várias vezes.
  • Devido a um problema de software, existe um limite para o ID de Grupo ANA máximo, enquanto o Control-Path não tem limite.
  • Ao mapear um volume para um host NVMe, o volume é classificado no grupo ANA correto; o grupo ANA é derivado do ID TPG do Nó proprietário do volume.
  • A operação de mapeamento pode levar a uma falha do módulo de software que pode levar à reinicialização do nó

 

Resolução

Este problema foi corrigido no PowerStoreOS 4.0.0.

 

Solução temporária

  • Encaminhe para os Serviços Globais para obter assistência e, após a recuperação, planeie a atualização para o PowerStoreOS 4.0.0. Consulte este artigo da Base de Dados de Conhecimento para obter uma atenção rápida.

 

Produtos afetados

PowerStore
Propriedades do artigo
Número do artigo: 000216639
Tipo de artigo: Solution
Último modificado: 28 mai. 2024
Versão:  3
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.