PowerStore: La mappatura di un volume NVMeoF può causare un'interruzione del servizio sui cluster con più appliance

Summary: La mappatura dei volumi NVMeoF in un cluster multi-appliance può causare un'interruzione del servizio per l'appliance su cui viene creato il volume.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

La mappatura dei volumi NVMeoF in un cluster multi-appliance può causare un'interruzione del servizio per l'appliance su cui viene creato il volume. Ciò può verificarsi solo nell'appliance#2 e versioni successive. Ciò non si verifica sul primo appliance.

 

Ambiente:

  • Cluster con più appliance
  • Gli host sono connessi tramite NVMe/FC o NVMe/TCP.
  • Si sono verificati (a) più errori di aggiunta di appliance o (b) più operazioni di rimozione di appliance.

 

Sintomi:

  • Il nodo potrebbe riavviarsi in modo imprevisto.
  • Se entrambi i nodi si riavviano, potrebbe verificarsi un'interruzione del servizio.

 

Cause

  • Su NVMeoF (NVMe/fc o NVMe/TCP), esiste un meccanismo di base per supportare l'accesso asimmetrico al namespace (ANA
    ). ANA si verifica sugli appliance in cui le caratteristiche di accesso ai volumi possono essere diverse tra i controller NVMe.
    Esempio: Il volume-1 sul nodo A può essere ottimizzato, mentre il volume-1 sul nodo B non è ottimizzato.
  • Il concetto è simile ad ALUA con Target Port Group (TPG):
    A ciascun nodo viene assegnato un ID TPG univoco per distinguere gli stati di ciascun nodo (ottimizzato e non ottimizzato)
  • Con NVMe-oF su PowerStore, ogni appliance dispone di diversi gruppi ANA:
    • ANA Group #1: utilizzato per la migrazione dei volumi tra appliance (l'ID gruppo è 1 in tutto il cluster)
    • ANA Group #X: utilizzato per descrivere i volumi in cui il Nodo A è ottimizzato e il Nodo B non è ottimizzato
    • ANA Group #Y: utilizzato per descrivere i volumi in cui il Nodo A non è ottimizzato e il Nodo B è ottimizzato
    • ANA Group #Z (utilizzo futuro): per descrivere i volumi in cui i nodi A e B sono ottimizzati (attivo/attivo)
  • Quando si aggiunge un appliance, Control-Path utilizza un numero di sequenza speciale per determinare l'ID del gruppo di porte di destinazione da creare.
    Questa sequenza si incrementa solo in caso di guasto dell'appliance aggiunto. La sequenza può essere piuttosto lunga se l'appliance aggiunto si guasta più volte.
  • A causa di un problema software, c'è un limite all'ID gruppo ANA massimo, mentre Control-Path non ha alcun limite.
  • Quando si esegue il mapping di un volume a un host NVMe, il volume viene classificato nel gruppo ANA corretto; il gruppo ANA deriva dall'ID TPG del nodo proprietario del volume.
  • L'operazione di mapping può causare un guasto del modulo software che potrebbe causare il riavvio di un nodo

 

Resolution

Questo problema è stato risolto in PowerStoreOS 4.0.0.

 

Soluzione alternativa

  • Rivolgiti ai Global Services per ricevere assistenza e, dopo il ripristino, pianifica l'upgrade a PowerStoreOS 4.0.0. Consultare questo articolo della Knowledge Base per una maggiore attenzione.

 

Affected Products

PowerStore
Article Properties
Article Number: 000216639
Article Type: Solution
Last Modified: 28 May 2024
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.