VPLEX: I guasti dei componenti nella fabric o nel controller dell'array portano alla non disponibilità dei dati sulle prestazioni
Summary: Questo articolo spiega come ridurre i problemi relativi al guasto di un singolo componente che possono influire sulle prestazioni in un'ambiente VPLEX.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
Riepilogo
problemiGli utenti finali potrebbero riscontrare un forte impatto su alcuni o tutti gli host connessi a VPLEX a causa di problemi come drain lenti, guasti del controller di destinazione dell'array, errori CRC, guasti ASIC dello switch, riavvii dello switch e così via. Il back-end VPLEX utilizza una policy Round Robin che può causare problemi su una fabric che influiscono su tutti i percorsi host su tale fabric (o possono influire anche sui percorsi sull'altra fabric).
Per i team
di switch e arraySe un utente finale segnala un impatto diffuso a causa di un guasto di un singolo componente, di un flusso lento e così via, verificare con l'utente finale se VPLEX è presente nell'ambiente. Se VPLEX è nell'ambiente e l'entità del problema è nota, richiedere all'utente finale di bloccare i percorsi interessati sullo switch. Se VPLEX si trova nell'ambiente e i percorsi interessati non sono noti, contattare il supporto clienti Dell EMC, spiegare il problema e fare riferimento a questo articolo.
Per il team
VPLEXSe è presente una SR in cui l'utente finale segnala un impatto continuo e si sospetta che la causa sia dovuta a percorsi back-end con prestazioni scarse, identificare i percorsi con prestazioni scarse e bloccarli in VPLEX. Se i percorsi interessati non sono evidenti, ingaggiare un allenatore per assistenza. Le collaborazioni tra switch e array possono essere eseguite una volta terminato l'impatto.
Priorità bassa
Flusso
di I/O da VPLEX ad arrayVPLEX funziona in modo molto simile a un'ambiente host in cluster. Ogni director, che riceve l'I/O dall host, è responsabile del completamento di tale I/O. Ogni director dispone di più percorsi su entrambe le fabric per ogni LUN. Ogni director VPLEX è responsabile del bilanciamento dell'I/O su tutti i percorsi attivi disponibili.
Rilevamento e mitigazione dei guasti VPLEX
Il metodo principale utilizzato da VPLEX per rilevare e mitigare gli errori dei percorsi consiste nel monitorare il rapporto dei timeout su ciascun percorso. Se il 90% dell'I/O scade in due periodi consecutivi di 15 secondi, VPLEX bandirà il percorso interessato e non lo utilizzerà più. VPLEX analizzerà quindi periodicamente il percorso bandito e lo annullerà se l'I/O viene rilevato di nuovo correttamente su questo percorso.
Come possono sorgere
i problemiA causa della soglia elevata per l'esclusione dei percorsi, del probing frequente e della soglia bassa per l'annullamento dell'esclusione del percorso, VPLEX potrebbe continuare a utilizzare percorsi non integri. Il risultato è che VPLEX può inviare una quantità significativa di I/O attraverso percorsi con prestazioni scarse o percorsi che hanno presentato errori software. Si verifica il timeout di questo I/O o il completamento di questo I/O richiede una quantità eccessiva di tempo. Il risultato sono tempi di risposta significativamente elevati su tutti i percorsi host. Ciò potrebbe comportare la non disponibilità dei dati sulle prestazioni per uno o tutti gli host connessi a VPLEX.
Raccomandazione
Eseguire l'aggiornamento al codice di destinazione di VPLEX GeoSynchrony 6.2 P3 o versione successiva per migliorare il rilievo/la gestione delle condizioni di cui sopra. Fare riferimento alle note di rilascio per ulteriori dettagli sulla funzionalità di gestione dei percorsi back-end.
problemiGli utenti finali potrebbero riscontrare un forte impatto su alcuni o tutti gli host connessi a VPLEX a causa di problemi come drain lenti, guasti del controller di destinazione dell'array, errori CRC, guasti ASIC dello switch, riavvii dello switch e così via. Il back-end VPLEX utilizza una policy Round Robin che può causare problemi su una fabric che influiscono su tutti i percorsi host su tale fabric (o possono influire anche sui percorsi sull'altra fabric).
Per i team
di switch e arraySe un utente finale segnala un impatto diffuso a causa di un guasto di un singolo componente, di un flusso lento e così via, verificare con l'utente finale se VPLEX è presente nell'ambiente. Se VPLEX è nell'ambiente e l'entità del problema è nota, richiedere all'utente finale di bloccare i percorsi interessati sullo switch. Se VPLEX si trova nell'ambiente e i percorsi interessati non sono noti, contattare il supporto clienti Dell EMC, spiegare il problema e fare riferimento a questo articolo.
Per il team
VPLEXSe è presente una SR in cui l'utente finale segnala un impatto continuo e si sospetta che la causa sia dovuta a percorsi back-end con prestazioni scarse, identificare i percorsi con prestazioni scarse e bloccarli in VPLEX. Se i percorsi interessati non sono evidenti, ingaggiare un allenatore per assistenza. Le collaborazioni tra switch e array possono essere eseguite una volta terminato l'impatto.
Priorità bassa
Flusso
di I/O da VPLEX ad arrayVPLEX funziona in modo molto simile a un'ambiente host in cluster. Ogni director, che riceve l'I/O dall host, è responsabile del completamento di tale I/O. Ogni director dispone di più percorsi su entrambe le fabric per ogni LUN. Ogni director VPLEX è responsabile del bilanciamento dell'I/O su tutti i percorsi attivi disponibili.
Rilevamento e mitigazione dei guasti VPLEX
Il metodo principale utilizzato da VPLEX per rilevare e mitigare gli errori dei percorsi consiste nel monitorare il rapporto dei timeout su ciascun percorso. Se il 90% dell'I/O scade in due periodi consecutivi di 15 secondi, VPLEX bandirà il percorso interessato e non lo utilizzerà più. VPLEX analizzerà quindi periodicamente il percorso bandito e lo annullerà se l'I/O viene rilevato di nuovo correttamente su questo percorso.
Come possono sorgere
i problemiA causa della soglia elevata per l'esclusione dei percorsi, del probing frequente e della soglia bassa per l'annullamento dell'esclusione del percorso, VPLEX potrebbe continuare a utilizzare percorsi non integri. Il risultato è che VPLEX può inviare una quantità significativa di I/O attraverso percorsi con prestazioni scarse o percorsi che hanno presentato errori software. Si verifica il timeout di questo I/O o il completamento di questo I/O richiede una quantità eccessiva di tempo. Il risultato sono tempi di risposta significativamente elevati su tutti i percorsi host. Ciò potrebbe comportare la non disponibilità dei dati sulle prestazioni per uno o tutti gli host connessi a VPLEX.
Raccomandazione
Eseguire l'aggiornamento al codice di destinazione di VPLEX GeoSynchrony 6.2 P3 o versione successiva per migliorare il rilievo/la gestione delle condizioni di cui sopra. Fare riferimento alle note di rilascio per ulteriori dettagli sulla funzionalità di gestione dei percorsi back-end.
Affected Products
VPLEX SeriesProducts
VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6Article Properties
Article Number: 000157795
Article Type: How To
Last Modified: 03 Jun 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.