PowerStore: NVMeoF 볼륨을 매핑하면 다중 어플라이언스 클러스터에서 서비스가 중단될 수 있음

Summary: 다중 어플라이언스 클러스터에서 NVMeoF 볼륨을 매핑하면 볼륨이 생성된 어플라이언스의 서비스가 중단될 수 있습니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

다중 어플라이언스 클러스터에서 NVMeoF 볼륨을 매핑하면 볼륨이 생성된 어플라이언스의 서비스가 중단될 수 있습니다. 이 문제는 어플라이언스#2 이상에서만 발생할 수 있습니다. 첫 번째 어플라이언스에서는 이 문제가 발생하지 않습니다.

 

환경:

  • 다중 어플라이언스 클러스터
  • 호스트는 NVMe/FC 또는 NVMe/TCP를 통해 연결됩니다.
  • (a) 어플라이언스 추가가 여러 번 실패했거나 (b) 어플라이언스 제거가 여러 번 수행되었습니다.

 

증상:

  • 노드가 예기치 않게 재부팅될 수 있습니다.
  • 두 노드가 모두 재부팅되면 서비스 중단이 발생할 수 있습니다.

 

Cause

  • NVMeoF(NVMe/FC 또는 NVMe/TCP)에는 ANA(Asymmetric Namespace Access)를 지원하는 기본 메커니즘이 있습니다.
    NVMe 컨트롤러 간에 볼륨 액세스 특성이 다를 수 있는 어플라이언스에서 ANA가 발생합니다.
    : Node-B의 Volume-1은 최적화되지 않는 동안 Node-A의 Volume-1은 최적화될 수 있습니다.
  • 이 개념은 TPG(Target Port Group)가 있는 ALUA와 유사합니다.
    각 노드에는 고유한 TPG ID가 할당되어 각 노드의 상태(최적화된 노드와 최적화되지 않은 노드)를 구분합니다
  • PowerStore에서 NVMe-oF를 사용하면 각 어플라이언스에 여러 ANA 그룹이 있습니다.
    • ANA 그룹 #1 - 어플라이언스 간 볼륨 마이그레이션에 사용(클러스터 전체에서 그룹 ID는 1)
    • ANA 그룹 #X - Node-A는 최적화되어 있고 Node-B는 최적화되지 않은 볼륨을 설명하는 데 사용됩니다.
    • ANA 그룹 #Y - Node-A가 최적화되지 않은 볼륨과 Node-B가 최적화된 볼륨을 설명하는 데 사용됩니다.
    • ANA 그룹 #Z(추후 사용) - Node-A 및 Node-B가 최적화된 볼륨(Active/Active)을 설명하는 데 사용됩니다.
  • 어플라이언스를 추가할 때 Control-Path는 특수 시퀀스 번호를 사용하여 생성할 타겟 포트 그룹 ID를 결정합니다.
    이 순서는 추가된 어플라이언스에 장애가 발생한 경우에도 증가합니다. 추가된 어플라이언스가 여러 번 실패하는 경우 시퀀스가 상당히 커질 수 있습니다.
  • 소프트웨어 문제로 인해 최대 ANA 그룹 ID에 제한이 있지만 Control-Path는 제한이 없습니다.
  • 볼륨을 NVMe 호스트에 매핑할 때 볼륨은 올바른 ANA 그룹으로 분류됩니다. ANA 그룹은 볼륨을 소유한 노드의 TPG ID에서 파생됩니다.
  • 매핑 작업으로 인해 소프트웨어 모듈 장애가 발생하여 노드가 재부팅될 수 있습니다

 

Resolution

이 문제는 PowerStoreOS 4.0.0에서 해결되었습니다.

 

해결 방법

  • 글로벌 서비스로 에스컬레이션하여 지원을 받고 복구 후 PowerStoreOS 4.0.0으로 업그레이드할 계획을 세웁니다. 신속한 주의는 이 KB 문서를 참조하십시오.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.