PowerStore: O mapeamento de um volume NVMeoF pode provocar a interrupção do serviço em clusters de vários appliances

Summary: O mapeamento de volumes NVMeoF num cluster de vários appliances pode provocar a interrupção do serviço do appliance no qual o volume é criado.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

O mapeamento de volumes NVMeoF num cluster de vários appliances pode provocar a interrupção do serviço do appliance no qual o volume é criado. Isto pode ocorrer apenas no appliance#2 e superior. Isso não ocorre no primeiro aparelho.

 

Ambiente:

  • Cluster de vários appliances
  • Os anfitriões estão ligados através de NVMe/FC ou NVMe/TCP.
  • Houve (a) várias falhas de adição de appliances ou (b) várias remoções de appliances realizadas.

 

Sintomas:

  • O nó pode reiniciar inesperadamente.
  • Se ambos os nós reiniciarem, pode ocorrer uma interrupção do serviço.

 

Cause

  • No NVMeoF (NVMe/FC ou NVMe/TCP), existe um mecanismo básico para suportar o acesso assimétrico ao namespace (ANA)
    ANA ocorre em dispositivos onde as características de acesso ao volume podem ser diferentes entre controladores NVMe.
    Exemplo: O Volume-1 no Nó-A pode ser otimizado, enquanto o Volume-1 no Nó-B não está otimizado.
  • O conceito é semelhante ao ALUA com Target Port Group (TPG):
    A cada nó é atribuído um ID TPG exclusivo para distinguir entre os estados de cada nó (o que está otimizado e o que não está otimizado)
  • Com o NVMe-oF no PowerStore, cada appliance tem vários grupos de ANA:
    • Grupo ANA #1 - Usado para migração de volume entre appliances (o ID do grupo é 1 em todo o cluster)
    • #X do Grupo ANA — Utilizado para descrever volumes em que o Nó A está otimizado e o Nó B não está otimizado
    • #Y do Grupo ANA — Utilizado para descrever volumes em que o Nó A não está otimizado e o Nó B está otimizado
    • ANA Group #Z (Utilização Futura) – Utilizada para descrever volumes em que o Nó A e o Nó B estão otimizados (Ativo/Ativo)
  • Ao adicionar um appliance, o Control-Path utiliza um número de sequência especial para determinar a ID do grupo de portas de destino a criar.
    Esta sequência só aumenta, mesmo quando o appliance adicionado falha. A sequência pode ser bastante grande se o appliance adicionado falhar várias vezes.
  • Devido a um problema de software, existe um limite para o ID de Grupo ANA máximo, enquanto o Control-Path não tem limite.
  • Ao mapear um volume para um host NVMe, o volume é classificado no grupo ANA correto; o grupo ANA é derivado do ID TPG do Nó proprietário do volume.
  • A operação de mapeamento pode levar a uma falha do módulo de software que pode levar à reinicialização do nó

 

Resolution

Este problema foi corrigido no PowerStoreOS 4.0.0.

 

Solução temporária

  • Encaminhe para os Serviços Globais para obter assistência e, após a recuperação, planeie a atualização para o PowerStoreOS 4.0.0. Consulte este artigo da Base de Dados de Conhecimento para obter uma atenção rápida.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.