VPLEX: I guasti dei componenti nella fabric o nel controller dell'array portano alla non disponibilità dei dati sulle prestazioni

Riepilogo: Questo articolo spiega come ridurre i problemi relativi al guasto di un singolo componente che possono influire sulle prestazioni in un'ambiente VPLEX.

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Istruzioni

Riepilogo
problemiGli utenti finali potrebbero riscontrare un forte impatto su alcuni o tutti gli host connessi a VPLEX a causa di problemi come drain lenti, guasti del controller di destinazione dell'array, errori CRC, guasti ASIC dello switch, riavvii dello switch e così via. Il back-end VPLEX utilizza una policy Round Robin che può causare problemi su una fabric che influiscono su tutti i percorsi host su tale fabric (o possono influire anche sui percorsi sull'altra fabric).
  
Per i team   
di switch e arraySe un utente finale segnala un impatto diffuso a causa di un guasto di un singolo componente, di un flusso lento e così via, verificare con l'utente finale se VPLEX è presente nell'ambiente. Se VPLEX è nell'ambiente e l'entità del problema è nota, richiedere all'utente finale di bloccare i percorsi interessati sullo switch. Se VPLEX si trova nell'ambiente e i percorsi interessati non sono noti, contattare il supporto clienti Dell EMC, spiegare il problema e fare riferimento a questo articolo.
 
Per il team
VPLEXSe è presente una SR in cui l'utente finale segnala un impatto continuo e si sospetta che la causa sia dovuta a percorsi back-end con prestazioni scarse, identificare i percorsi con prestazioni scarse e bloccarli in VPLEX. Se i percorsi interessati non sono evidenti, ingaggiare un allenatore per assistenza. Le collaborazioni tra switch e array possono essere eseguite una volta terminato l'impatto.
 
Priorità bassa
Flusso
di I/O da VPLEX ad arrayVPLEX funziona in modo molto simile a un'ambiente host in cluster. Ogni director, che riceve l'I/O dall host, è responsabile del completamento di tale I/O. Ogni director dispone di più percorsi su entrambe le fabric per ogni LUN. Ogni director VPLEX è responsabile del bilanciamento dell'I/O su tutti i percorsi attivi disponibili.
 
Rilevamento e mitigazione dei guasti VPLEX
Il metodo principale utilizzato da VPLEX per rilevare e mitigare gli errori dei percorsi consiste nel monitorare il rapporto dei timeout su ciascun percorso. Se il 90% dell'I/O scade in due periodi consecutivi di 15 secondi, VPLEX bandirà il percorso interessato e non lo utilizzerà più. VPLEX analizzerà quindi periodicamente il percorso bandito e lo annullerà se l'I/O viene rilevato di nuovo correttamente su questo percorso.
 
Come possono sorgere
i problemiA causa della soglia elevata per l'esclusione dei percorsi, del probing frequente e della soglia bassa per l'annullamento dell'esclusione del percorso, VPLEX potrebbe continuare a utilizzare percorsi non integri. Il risultato è che VPLEX può inviare una quantità significativa di I/O attraverso percorsi con prestazioni scarse o percorsi che hanno presentato errori software. Si verifica il timeout di questo I/O o il completamento di questo I/O richiede una quantità eccessiva di tempo. Il risultato sono tempi di risposta significativamente elevati su tutti i percorsi host. Ciò potrebbe comportare la non disponibilità dei dati sulle prestazioni per uno o tutti gli host connessi a VPLEX.


Raccomandazione
Eseguire l'aggiornamento al codice di destinazione di VPLEX GeoSynchrony 6.2 P3 o versione successiva per migliorare il rilievo/la gestione delle condizioni di cui sopra. Fare riferimento alle note di rilascio per ulteriori dettagli sulla funzionalità di gestione dei percorsi back-end.

Prodotti interessati

VPLEX Series

Prodotti

VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6
Proprietà dell'articolo
Numero articolo: 000157795
Tipo di articolo: How To
Ultima modifica: 03 giu 2025
Versione:  4
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.