Article Number: 000188498

VPLEX: i volumi di storage segnalano "Operational Status" e "Health State" come unknown

Summary: Per via della mancata corrispondenza di versione tra il server di gestione e i director, tutti i volumi di storage indicano "Operational Status" e "Health State" come "unknown". ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content

Symptoms

In caso di mancata corrispondenza di versione, in cui un aggiornamento del firmware VPLEX non riesce e viene eseguito il rollback, VPLEX VS6 MMCS-A (server di gestione) potrebbe essere in una versione più recente del firmware (6.2.x) e i director nella versione originale precedente (ad esempio, 6.1.x). Ciò causa un problema di entità minore con l'interfaccia utente di VPLEX e tutti i volumi di storage nel sistema segnalano "Operational Status" e "Health Status" come "unknown". Tuttavia, eseguendo un controllo più approfondito, i volumi sono attivi e il volume virtuale di livello superiore non è danneggiato.

1] Verificare la mancata corrispondenza a livello di codice. Questa operazione può essere eseguita utilizzando il comando VPlexcli "health-check" e/o il comando VPlexcli "version-a".

L'esempio riportato di seguito rappresenta la sezione superiore dell'output di health-check:

Product Version: Version mismatch (or NDU) << mismatch indicates there is a different                                                                                                     firmware version between the                                                                                                     management server and directors Product Type: Metro WAN Connectivity Type: FC Hardware Type: VPL <-- represents the VS6 Cluster Size: 4 engines <-- says this is Quad Engine configuration, 2 = Dual and 1 = Single Cluster TLA:      cluster-1: CKMXXXXXXXXXXX      cluster-2: CKMXXXXXXXXXXX The storage-volume issue is most apparent in the VPlexcli command “storage-volume summary” output and is also visible from the Back-End (BE) Storage portion of the 'health-check' command output. The issue is not reported in the 'ndu pre-check', the 'connectivity validate-be', nor the 'cluster-status' command outputs. Example from VPlexcli outputs provided below. Before the failed NDU attempt no storage volumes will report as 'unknown', yet after the failed NDU we will see the following, the storage-volume 'IO status' will equal 'alive', however, the 'Operational Status' and the 'Health State'  will equal 'unknown' for all storage volumes. VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name                       IO Status  Operational Status  Health State ---------------------------------------  ---------  ------------------  ------------ VCKM001530XXX1-00003                     alive      unknown             unknown  << observe VCKM001530XXX2-00004                     alive      unknown             unknown  << VCKM001530XXX3-00006                     alive      unknown             unknown  << . . Storage-Volume Summary  (no tier) ----------------------  --------------------- Health                  out-of-date         0                         storage-volumes  4372  << note the total number of storage volumes in the system                                            unhealthy        4372  << note the total number of volumes equal unhealthy, all                                                                                          storage volumes in the system are now reporting                                                                                          unhealthy. Vendor                  DGC              1276                         XtremIO          3096 Use                     claimed             1                         meta-data           4                         unclaimed           5                         used             4362 Capacity                total           2.92P From the VPLEX 'health-check' command output scroll to the section called “BE Storage” and check the “Unhealthy Storage Volumes” to see all volumes are reported Unhealthy. BE Storage: << ----------- Cluster    Total     Unhealthy  Total Storage  No     Not visible  With         Total     Name       Storage   Storage    Provisioned/   Dual   from         Unsupported  Extents/             Volumes/  Volumes    Limit          Paths  All Dirs     # of Paths   Limit                Limit                                                                           ---------  --------  ---------  -------------  -----  -----------  -----------  --------  cluster-1  4372/12000 4372      2.92P/8PB      0      0            0            4362/24000 cluster-2  4372/12000 4372      2.92P/8PB      0      0            0            4362/24000

Osservando "FE Storage" direttamente sotto la sezione "BE storage" dell'output del comando "health-check" discusso in precedenza, si notano 0 (o meno) volumi virtuali non integri. Questo è fondamentale per confermare che si tratta di un problema di minore entità con l'interfaccia utente di VPLEX.

[Nota]: se fosse presente un reale problema con i volumi di storage, il volume virtuale di livello superiore verrebbe in qualche modo segnalato come danneggiato. Inoltre, dovrebbero essere visualizzati 0 (o meno) volumi virtuali danneggiati nel comando VPlexcli "virtual-volume summary". Tuttavia, se vengono segnalati volumi virtuali danneggiati/non integri, interrompere l'operazione, poiché potrebbe verificarsi un problema distinto che richiede ulteriori indagini al di fuori dell'ambito di questo articolo della KB.

FE Storage: ----------- Cluster    Total       Unhealthy  Total Dist  Unhealthy  Local          With unsupported  Name       Virtual     Virtual    Devs/       Dist       Top-Level      RAID1 mirror        Volumes/    Volumes    Limit       Devs       Devices/Limit  legs                Limit                                                                          ---------  ----------  ---------  ----------  ---------  -------------  ----------------  cluster-1  3794/12000  0          1024/12000  0          2770/12000     0                 cluster-2  4356/12000  0          1024/12000  0          3333/12000     0

Cause

Quando si aggiorna il firmware VPLEX, la procedura generale è la seguente:

Aggiornare il server di gestione VS6 (MMCS-A) alla nuova versione di destinazione successiva
Aggiornare i director VPLEX alla nuova versione di destinazione successiva

Queste operazioni vengono eseguite in due passaggi distinti, creando un'ora in cui il server di gestione esegue il nuovo codice (6.2.x in questo caso) e i director sono ancora nella versione originale precedente (ad esempio, 6.1.x), nel qual caso può verificarsi il problema di cui sopra.

Nei casi in cui si verifica un problema o un blocco nel completamento dell'aggiornamento del codice sui director, la mancata corrispondenza tra il codice MMCS e i director potrebbe persistere per un periodo prolungato durante l'analisi del problema o del blocco dell'aggiornamento. Durante questo periodo tutti i volumi di storage vengono segnalati come sconosciuti.

Questo problema è causato dalla mancata corrispondenza di versione tra il server di gestione e i director. Il comando del firmware sottostante presenta errori, determinando lo stato "unknown" per "Health State".
Come si può notare dalla ripetizione dell'evento riportato di seguito nei log del client:

[https-jsse-nio-49881-exec-9] CommandResult: Command 'mdi get disk --tabular diskId ioStatus where visibility == "external" and ioStatus != "ok"' returned error code 1000000015 (invalid subcommand).

Il comando presenta errori perché genera un comando secondario presente nella versione 6.2 ma non nella versione 6.1.x e pertanto viene restituito come non valido dal firmware dei director, determinando lo stato "unknown" descritto in precedenza.

Resolution

In genere, è consentito operare con mancata corrispondenza del firmware per un periodo di tempo, tuttavia si consiglia di non rimanere in questo stato per troppo tempo e di risolvere il problema il prima possibile.

Risoluzione:
Questo problema viene risolto una volta completato l'aggiornamento del firmware dei director. A quel punto, i director e il server di gestione saranno nella stessa versione del codice corrispondente. Questa è l'opzione preferita per risolvere il problema ed è consigliabile applicarla.

Come indicato in precedenza in questo articolo, si tratta di un problema di entità minore ed è comunque possibile procedere con l'aggiornamento del firmware dei director.

Questo problema, anche se di minore entità, può determinare altri problemi correlati, ad esempio:

Ritardi nell'aggiornamento di VPLEX. Se il problema viene rilevato dal tecnico responsabile degli aggiornamenti (RCM) tra l'aggiornamento del server di gestione e dei director (RCM), potrebbe presumere che vi sia un reale problema correlato ai volumi di storage e arrestare l'aggiornamento per analizzare la questione. Tuttavia, se il tecnico che esegue l'aggiornamento non è sicuro o ha dubbi su questa situazione, contattare il supporto VPLEX.
Per il prodotto AppSync, perché esegue una query sullo stato dei volumi di storage VPLEX e, se riceve la risposta "unknown", può avere problemi operativi.

Soluzione alternativa:
Nei casi in cui non sia possibile operare con la mancata corrispondenza a livello di firmware, contattare il supporto Dell EMC VPLEX richiedendo ulteriore assistenza e citando questo articolo.

VPLEX: i volumi di storage segnalano "Operational Status" e "Health State" come unknown

Summary: Per via della mancata corrispondenza di versione tra il server di gestione e i director, tutti i volumi di storage indicano "Operational Status" e "Health State" come "unknown". ...

Article Content

Symptoms

Cause

Resolution

Article Properties

Affected Product

Last Published Date

Version

Article Type

Welcome

Welcome to Dell

VPLEX: i volumi di storage segnalano "Operational Status" e "Health State" come unknown

Summary: Per via della mancata corrispondenza di versione tra il server di gestione e i director, tutti i volumi di storage indicano "Operational Status" e "Health State" come "unknown". ... View More View Less

Article Content

Symptoms

Cause

Resolution

Article Properties

Affected Product

Last Published Date

Version

Article Type

Summary: Per via della mancata corrispondenza di versione tra il server di gestione e i director, tutti i volumi di storage indicano "Operational Status" e "Health State" come "unknown". ...