PowerStore : Le mappage d’un volume NVMeoF peut entraîner une interruption de service sur les clusters à plusieurs appliances

Sommaire: Le mappage des volumes NVMeoF sur un cluster à plusieurs appliances peut entraîner une interruption de service pour l’appliance sur laquelle le volume est créé.

Cet article s’applique à Cet article ne s’applique pas à Cet article n’est lié à aucun produit spécifique. Toutes les versions de produits ne sont pas identifiées dans cet article.

Symptômes

Le mappage des volumes NVMeoF sur un cluster à plusieurs appliances peut entraîner une interruption de service pour l’appliance sur laquelle le volume est créé. Cela ne peut se produire que dans l’appliance #2 et versions ultérieures. Cela ne se produit pas sur la première appliance.

 

Environnement :

  • Cluster à plusieurs appliances
  • Les hôtes sont connectés via NVMe/FC ou NVMe/TCP.
  • Il y a eu (a) plusieurs échecs d’ajout d’appliance ou (b) plusieurs suppressions d’appliances.

 

Symptômes :

  • Le nœud peut redémarrer de manière inattendue.
  • Si les deux nœuds redémarrent, une interruption de service peut se produire.

 

Cause

  • Sur NVMeoF (NVMe/FC ou NVMe/TCP), un mécanisme de base existe pour prendre en charge l’accès asymétrique à l’espace de nommage (ANA).
    L’ANA se produit sur les appliances où les caractéristiques d’accès au volume peuvent être différentes entre les contrôleurs NVMe.
    Exemple : Le volume-1 sur le nœud A peut être optimisé tandis que le volume-1 sur le nœud B n’est pas optimisé.
  • Le concept est similaire à ALUA avec Target Port Group (TPG) :
    Chaque nœud se voit attribuer un ID TPG unique pour faire la distinction entre les états de chaque nœud (qui est optimisé et qui ne l’est pas)
  • Avec NVMe-oF sur PowerStore, chaque appliance dispose de plusieurs groupes ANA :
    • Groupe ANA #1 : utilisé pour la migration de volume entre appliances (l’ID de groupe est 1 sur l’ensemble du cluster)
    • Groupe ANA #X : utilisé pour décrire les volumes où le nœud A est optimisé et le nœud B est non optimisé
    • Groupe ANA #Y : utilisé pour décrire les volumes où le nœud A n’est pas optimisé et le nœud B est optimisé
    • Groupe ANA #Z (utilisation future) : pour décrire les volumes sur lesquels les nœuds A et B sont optimisés (actif/actif)
  • Lors de l’ajout d’une appliance, Control-Path utilise un numéro de séquence spécial pour déterminer l’ID du groupe de ports cibles à créer.
    Cette séquence s’incrémente uniquement, même en cas de défaillance de l’appliance ajoutée. La séquence peut être assez volumineuse si l’appliance ajoutée échoue plusieurs fois.
  • En raison d’un problème logiciel, il existe une limite sur le nombre maximal d’ID de groupe ANA, alors que Control-Path n’a pas de limite.
  • Lors du mappage d’un volume à un hôte NVMe, le volume est classé dans le groupe ANA approprié ; le groupe ANA est dérivé de l’ID TPG du nœud propriétaire du volume.
  • L’opération de mappage peut entraîner une défaillance du module logiciel pouvant entraîner un redémarrage du nœud

 

Résolution

Ce problème est résolu dans PowerStoreOS 4.0.0.

 

Solution

  • Faites remonter le problème aux services globaux pour obtenir de l’aide. Après la récupération, prévoyez d’effectuer une mise à niveau vers PowerStoreOS 4.0.0. Consultez cet article de la base de connaissances pour une intervention plus rapide.

 

Produits touchés

PowerStore
Propriétés de l’article
Numéro d’article: 000216639
Type d’article: Solution
Dernière modification: 28 mai 2024
Version:  3
Obtenez des réponses à vos questions auprès d’autre utilisateurs de Dell
Services de soutien
Vérifiez si votre appareil est couvert par les services de soutien.