PowerStore: Mapowanie woluminu NVMeoF może prowadzić do zakłóceń usług w klastrach z wieloma urządzeniami

Summary: Mapowanie woluminów NVMeoF w klastrze z wieloma urządzeniami może spowodować zakłócenie usługi dla urządzenia, na którym wolumin, na którym został utworzony.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Mapowanie woluminów NVMeoF w klastrze z wieloma urządzeniami może spowodować zakłócenie usługi dla urządzenia, na którym wolumin, na którym został utworzony. Może to wystąpić tylko w urządzeniu #2 i nowszych. Nie dzieje się tak w pierwszym urządzeniu.

 

Środowisko:

  • Klaster z wieloma urządzeniami
  • Hosty są połączone za pośrednictwem NVMe/FC lub NVMe/TCP.
  • Wystąpiły (a) wielokrotne błędy dodawania urządzeń lub (b) wielokrotne usuwanie urządzeń.

 

Objawy:

  • Węzeł może nieoczekiwanie uruchomić się ponownie.
  • Jeśli oba węzły uruchomią się ponownie, może wystąpić zakłócenie usługi.

 

Cause

  • W NVMeoF (NVMe/FC lub NVMe/TCP) istnieje podstawowy mechanizm obsługi asymetrycznego dostępu do przestrzeni nazw (ANA).
    ANA występuje na urządzeniach, w których charakterystyka dostępu do woluminu może być różna w przypadku kontrolerów NVMe.
    Przykład: Wolumin 1 w węźle A może być zoptymalizowany, podczas gdy wolumin 1 w węźle B nie jest zoptymalizowany.
  • Koncepcja jest podobna do ALUA z Target Port Group (TPG):
    Każdy węzeł ma przypisany unikatowy identyfikator TPG w celu odróżnienia stanów każdego węzła (który jest zoptymalizowany, a który niezoptymalizowany)
  • W przypadku NVMe-oF na PowerStore każde urządzenie ma kilka grup ANA:
    • ANA Group #1 — używana do migracji woluminów między urządzeniami (identyfikator grupy to 1 w klastrze)
    • ANA Group #X — służy do opisywania woluminów, w których węzeł A jest zoptymalizowany, a węzeł B nie jest zoptymalizowany
    • ANA Group #Y — służy do opisywania woluminów, w których węzeł A nie jest zoptymalizowany, a węzeł B jest zoptymalizowany
    • ANA Group #Z (Future Use) — służy do opisywania woluminów, w których węzeł A i węzeł B są zoptymalizowane (aktywny/aktywny)
  • Podczas dodawania urządzenia Control-Path używa specjalnego numeru sekwencyjnego do określenia identyfikatora grupy portów docelowych do utworzenia.
    Ta sekwencja zwiększa się tylko wtedy, gdy dodanie urządzenia ulegnie awarii. Sekwencja może być dość duża, jeśli dodane urządzenie ulegnie kilkukrotnej awarii.
  • Ze względu na problem z oprogramowaniem istnieje limit maksymalnego identyfikatora grupy ANA, podczas gdy ścieżka kontrolna nie ma limitu.
  • Podczas mapowania woluminu na hosta NVMe wolumin jest klasyfikowany do odpowiedniej grupy ANA; Grupa ANA jest określana na podstawie identyfikatora TPG węzła, który jest właścicielem woluminu.
  • Operacja mapowania może doprowadzić do awarii modułu oprogramowania, która może doprowadzić do ponownego uruchomienia węzła

 

Resolution

Ten problem został rozwiązany w systemie PowerStoreOS 4.0.0.

 

Obejście problemu

  • Przekaż problem do usług globalnych w celu uzyskania pomocy, a po zakończeniu odzyskiwania zaplanuj uaktualnienie systemu PowerStoreOS do wersji 4.0.0. Zapoznaj się z tym artykułem bazy wiedzy, aby uzyskać przyspieszoną uwagę.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.