PowerStore. Сопоставление тома NVMeoF может привести к прерыванию работы служб в кластерах с несколькими устройствами

Summary: Сопоставление томов NVMeoF в кластере с несколькими устройствами может привести к прерыванию работы служб устройства, в котором создан том.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Сопоставление томов NVMeoF в кластере с несколькими устройствами может привести к прерыванию работы служб устройства, в котором создан том. Это может происходить только в устройстве#2 и выше. На первом устройстве этого не происходит.

 

Инфраструктура.

  • Кластер с несколькими устройствами
  • Хосты подключаются по протоколу NVMe/FC или NVMe/TCP.
  • Имело место (а) несколько сбоев при добавлении устройства или (б) выполнено несколько операций удаления устройств.

 

Признаки:

  • Узел может неожиданно перезагрузиться.
  • Если оба узла перезагрузятся, может произойти прерывание работы сервиса.

 

Cause

  • В NVMeoF (NVMe/fc или nvme/TCP) существует базовый механизм поддержки асимметричного доступа к пространству имен (ANA).
    ANA возникает на устройствах, где характеристики доступа к томам могут различаться для разных контроллеров NVMe.
    Пример. Том 1 на узле A можно оптимизировать, а том 1 на узле B — нет.
  • Концепция аналогична ALUA с целевой группой портов (TPG):
    Каждому узлу присваивается уникальный идентификатор TPG, который позволяет различать состояния каждого узла (оптимизированное, а какое нет)
  • При использовании NVMe-oF в PowerStore каждое устройство имеет несколько групп ANA:
    • ANA Group #1 — используется для миграции томов между устройствами (идентификатор группы — 1 в кластере)
    • Группа ANA #X — используется для описания томов, в которых узел А оптимизирован, а узел В не оптимизирован.
    • Группа #Y ANA — используется для описания томов, в которых узел А не оптимизирован, а узел Б оптимизирован.
    • Группа ANA #Z (будущее использование) — используется для описания томов, в которых оптимизированы узлы А и Б («активный-активный»).
  • При добавлении устройства Control-Path использует специальный порядковый номер для определения идентификатора создаваемой целевой группы портов.
    Эта последовательность только увеличивается, даже если добавленное устройство завершается сбоем. Последовательность может быть довольно большой, если добавленное устройство выходит из строя несколько раз.
  • Из-за проблемы с программным обеспечением существует ограничение на максимальный идентификатор группы ANA, в то время как для Control-Path ограничений нет.
  • При сопоставлении тома с хостом NVMe том классифицируется по правильной группе ANA. Группу ANA можно получить на основе идентификатора группы TPG для узла, которому принадлежит том.
  • Операция сопоставления может привести к сбою программного модуля, что может привести к перезагрузке узла

 

Resolution

Эта проблема устранена в PowerStoreOS 4.0.0.

 

Временное решение

  • Обратитесь за помощью в Global Services и планируйте модернизацию до PowerStoreOS 4.0.0 после восстановления. Для ускоренного внимания ознакомьтесь с этой статьей базы знаний.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.