VPLEX: Come diagnosticare e monitorare i problemi di back-end con la migliore gestione dei percorsi back-end (BEPM) in GeoSynchrony 6.2
Summary: In questo articolo viene illustrata la funzione di gestione dei percorsi back-end (BE) aggiunta a GeoSynchrony 6.2 e versioni successive. Viene inoltre illustrata la gestione della congestione della rete Back-End tramite la funzionalità BE Path Management modificata. ...
Symptoms
Nella versione precedente a GeoSynchrony 6.2, VPLEX non riusciva a isolare alcuni percorsi ai volumi di storage back-end con elevata latenza a causa di congestione della fabric o problemi dell'array di storage. Nella versione 6.2, VPLEX isola automaticamente i percorsi con prestazioni scarse verso i volumi di storage (percorsi che riscontrano latenza elevata) e li ripristina automaticamente quando le prestazioni tornano a livelli accettabili.
Nuove Call Home introdotte in GeoSynchrony 6.2:
0x8a6b6001 - bepm/1 - Le prestazioni di un IT nexus back-end sono scese al di sotto dei livelli accettabili.
0x8a6b6004 - bepm/4 - Sono stati rilevati periodi ripetuti di scarse prestazioni su un IT nexus back-end.
0x8a6b6007 bepm/7 - Tutte le ITL (Initiator-Target-LUN) su un'unità logica su questo director riscontrano prestazioni scadenti, pertanto l'unità logica viene contrassegnata come danneggiata.
I percorsi back-end sono costituiti da un iniziatore (porta BE VPLEX) e da una destinazione (porta sull'array) e vengono definiti IT Nexus.
Nuovi comandi CLI per controllare quali percorsi BE potrebbero essere in uno stato danneggiato:back-end degraded list e back-end degraded recover
Fare riferimento alla Guida alla CLI di VPLEX 6.2 per ulteriori informazioni sull'utilizzo di questi comandi.
Le back-end degraded list mostra eventuali I-Ts che VPLEX ha ridotto a causa dell'elevata latenza.
Di seguito viene illustrato l'utilizzo del help (-h) option con il comando per vedere come il comando può essere usato:
VPlexcli:/>back-end degraded list -h
synopsis: list [<opzioni>]
Visualizza un elenco di I-Ts danneggiati:
options (* = richiesto):
-h | --help
Visualizza l'utilizzo di questo comando.
--verbose
Fornisce un output maggiore durante l'esecuzione del comando. Questo potrebbe non avere alcun effetto per alcuni comandi.
-g | --group-by= <group_by>
Gruppo di I-T degradati dal campo specifico. Campi supportati: array, director
Esempio di IT contrassegnati come danneggiati - visualizzati con Degradation Reason di Degraded performance:
VPlexcli:/> elenco
back-end danneggiatoI-Ts danneggiati:
Director Director Port Initiator Motivo di danneggiamento dell'array
di destinazione-------------- ------------- ------------------ ------------------ --------------------------- --------------------
director-1-1-A A1-FC00 0xc00144878f110800 0x50060160086429bb EMC-CLARiiON-APM00140624008 Prestazioni ridotte
A1-FC00 0xc00144878f110800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 prestazioni ridotte
A1-FC00 0xc00144878f110800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 prestazioni ridotte
A1-FC01 0xc00144878f110900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 prestazioni ridotte
A1-FC01 0xc00144878f110900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 prestazioni ridotte
director-1-1-B B1-FC00 0xc00144878f118800 0xc00144878f3d0000 EMC-Invista-LABRATS4900007 prestazioni ridotte
B1-FC00 0xc00144878f118800 0xc00144878f3d0200 EMC-Invista-LABRATS4900007 prestazioni ridotte
B1-FC01 0xc00144878f118900 0xc00144878f3d0100 EMC-Invista-LABRATS4900007 prestazioni ridotte
B1-FC01 0xc00144878f118900 0xc00144878f3d0300 EMC-Invista-LABRATS4900007 prestazioni ridotte
Se viene rilevato che un percorso IT back-end passa da danneggiato a non danneggiato (intermittente) tre volte in un periodo di 30 minuti, IT Nexus viene considerato instabile e VPLEX interrompe automaticamente l'utilizzo di IT Nexus per l'I/O basato su host e segnala l'evento call home 0x8a6b6004 o bepm/4 nei registri del firmware. Quando si trova in questo stato, il back-end degraded list Elenchi di comandi Degradation Reason come Isolated due to unstable performance.
In questo caso, IT Nexus rimarrà danneggiato fino a quando l'utente finale non lo ripristinerà manualmente utilizzando il comando CLI back-end degraded recovero viene raggiunta la soglia predefinita di quattro ore, dopodiché viene contrassegnato l'IT Nexus Performance degraded mentre il processo di ripristino controlla la propria integrità prima di ripristinarne le prestazioni (e riabilitando automaticamente il percorso per servire nuovamente l'I/O basato su host se i test delle prestazioni vengono superati).
Esempio di stato instabile (peggioramento intermittente delle prestazioni) Degradation Reason è Isolated due to unstable performance:
VPlexcli:/>back-end degraded list
Degraded I-Ts:
Director Director Initiator Target Array Degradation Reason
-------------- Port ------------------ ------------------ ------------------------------- -----------------------
-------------- ------------ ------------------ ------------------ ------------------------------- -----------------------
director-1-1-A A1-FC00 0xc001448798b90800 0x5000097398037804 EMC-SYMMETRIX-197600222 Isolato a causa di prestazioni
instabili A1-FC00 0xc001448798b90800 0x5000097398037805 EMC-SYMMETRIX-197600222 Isolato a causa di prestazioni
instabili Se nessun percorso risulta danneggiato, il back-end degraded list il comando segnala questo:
VPlexcli:/>back-end degraded list
No paths are currently degraded.
L'altro nuovo comando CLI, back-end degraded recover, è destinato ai percorsi back-end danneggiati. Di seguito viene illustrato l'utilizzo del help (-h) opzione con l'opzione back-end degraded recover comando per vedere come il comando può essere usato:
VPlexcli:/>back-end degraded recover -h
synopsis: recover [<opzioni>]
Ripristina l'I-Ts danneggiato specificato:
opzioni (* = richiesto):
-h | --help
Visualizza l'utilizzo di questo comando.
--verbose
Fornisce un output maggiore durante l'esecuzione del comando. Questo potrebbe non avere alcun effetto per alcuni comandi.
-p | --paths= <paths>
I-T degradati da recuperare. Ogni I-T deve essere espresso come coppia nel formato "(<initiator>,<target>)".
--tutto
Ripristinare tutti gli I-T attualmente danneggiati.
Esempio di singolo I-T per il ripristino, visualizzato con Degradation Reason di Isolated due to unstable performance:
VPlexcli:/>back-end degraded recover -p (0xc00144878bda0900,0x5006016547e01af9)
I-Ts ripristinati:
Director Director Port Initiator Motivo
del danneggiamento dell'array di destinazione-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC01 0xc00144878bda0900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Isolato a causa di prestazioni
instabili Esempio di tutti gli I-T danneggiati da ripristinare:
VPlexcli:/>back-end degraded recover --all
Recovered I-Ts:
Director Director Port Initiator Target Array Degradation Reason
-------------- ------------- ------------------ ------------------ --------------------------- ------------------
director-1-1-A A1-FC00 0xc00144878bda0800 0x5000144260321e00 EMC-Invista-rc-surry-1 Isolato a causa di prestazioni
instabilidirector-1-1-B B1-FC01 0xc00144878bda8900 0x5006016547e01af9 EMC-CLARiiON-APM00164919257 Isolato a causa di prestazioni
instabili Se il problema di latenza intermittente persiste per l'IT Nexus interessato e l'utente non è in grado di risolvere rapidamente la root cause, si consiglia di contattare l'assistenza clienti VPLEX, tramite Live Chat, per contrassegnare manualmente l'IT Nexus come danneggiato e rimuovere il percorso dall'uso fino a quando il problema sottostante non può essere risolto.
Cause
I problemi esterni a VPLEX, come la congestione del fabric o problemi di array, possono causare problemi di back-end per VPLEX. Sebbene GeoSynchrony 6.2 sia progettato per gestire meglio questi tipi di congestione BE, si consiglia di risolvere la congestione il prima possibile.
Per individuare l'origine della congestione, Dell dispone di una funzione di monitoraggio delle porte FC che monitora gli errori nella fabric di qualsiasi porta FC BE. I risultati possono aiutare a restringere i problemi di rete nel fabric. A partire da GeoSynchrony 6.2, FC Port Monitor è attivo per impostazione predefinita.
Se è ancora in esecuzione una versione di GeoSynchrony 6.0.x o 6.1.x e non si è ancora pronti per eseguire l'aggiornamento alla versione 6.2.x, ma si desidera caricare lo script di monitoraggio delle porte FC su VPLEX, contattare il supporto clienti Dell per caricare lo script.
Resolution
GeoSynchrony 6.2 è stato progettato per gestire meglio questo tipo di congestione della rete. Quando viene attivata la funzione BEPM del codice VPLEX, indica problemi esterni a VPLEX. La causa della congestione della rete o dei problemi dell'array di storage deve essere risolta immediatamente. I dati forniti dai registri VPLEX possono essere utilizzati per restringere il campo in cui si verificano i problemi. Una volta risolto il problema, VPLEX ripristina automaticamente gli I-Ts che ora risulteranno integri.