PowerStore. Сопоставление тома NVMeoF может привести к прерыванию работы служб в кластерах с несколькими устройствами

Сводка: Сопоставление томов NVMeoF в кластере с несколькими устройствами может привести к прерыванию работы служб устройства, в котором создан том.

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

Сопоставление томов NVMeoF в кластере с несколькими устройствами может привести к прерыванию работы служб устройства, в котором создан том. Это может происходить только в устройстве#2 и выше. На первом устройстве этого не происходит.

 

Инфраструктура.

  • Кластер с несколькими устройствами
  • Хосты подключаются по протоколу NVMe/FC или NVMe/TCP.
  • Имело место (а) несколько сбоев при добавлении устройства или (б) выполнено несколько операций удаления устройств.

 

Признаки:

  • Узел может неожиданно перезагрузиться.
  • Если оба узла перезагрузятся, может произойти прерывание работы сервиса.

 

Причина

  • В NVMeoF (NVMe/fc или nvme/TCP) существует базовый механизм поддержки асимметричного доступа к пространству имен (ANA).
    ANA возникает на устройствах, где характеристики доступа к томам могут различаться для разных контроллеров NVMe.
    Пример. Том 1 на узле A можно оптимизировать, а том 1 на узле B — нет.
  • Концепция аналогична ALUA с целевой группой портов (TPG):
    Каждому узлу присваивается уникальный идентификатор TPG, который позволяет различать состояния каждого узла (оптимизированное, а какое нет)
  • При использовании NVMe-oF в PowerStore каждое устройство имеет несколько групп ANA:
    • ANA Group #1 — используется для миграции томов между устройствами (идентификатор группы — 1 в кластере)
    • Группа ANA #X — используется для описания томов, в которых узел А оптимизирован, а узел В не оптимизирован.
    • Группа #Y ANA — используется для описания томов, в которых узел А не оптимизирован, а узел Б оптимизирован.
    • Группа ANA #Z (будущее использование) — используется для описания томов, в которых оптимизированы узлы А и Б («активный-активный»).
  • При добавлении устройства Control-Path использует специальный порядковый номер для определения идентификатора создаваемой целевой группы портов.
    Эта последовательность только увеличивается, даже если добавленное устройство завершается сбоем. Последовательность может быть довольно большой, если добавленное устройство выходит из строя несколько раз.
  • Из-за проблемы с программным обеспечением существует ограничение на максимальный идентификатор группы ANA, в то время как для Control-Path ограничений нет.
  • При сопоставлении тома с хостом NVMe том классифицируется по правильной группе ANA. Группу ANA можно получить на основе идентификатора группы TPG для узла, которому принадлежит том.
  • Операция сопоставления может привести к сбою программного модуля, что может привести к перезагрузке узла

 

Разрешение

Эта проблема устранена в PowerStoreOS 4.0.0.

 

Временное решение

  • Обратитесь за помощью в Global Services и планируйте модернизацию до PowerStoreOS 4.0.0 после восстановления. Для ускоренного внимания ознакомьтесь с этой статьей базы знаний.

 

Затронутые продукты

PowerStore
Свойства статьи
Номер статьи: 000216639
Тип статьи: Solution
Последнее изменение: 28 May 2024
Версия:  3
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.