VPLEX: Latenza di scrittura elevata sui dispositivi distribuiti VPlex a causa di problemi di prestazioni di back-end
Riepilogo: Questo articolo spiega come utilizzare la funzione di isolamento mirror in caso di problemi di prestazioni back-end sui dispositivi VPLEX RAID-1.
Sintomi
Gli host riscontrano una latenza di scrittura elevata che potrebbe causare una non disponibilità dei dati delle prestazioni.
Dal lato VPlex, potrebbe esserci un flusso di interruzioni dell host (eventi stdf/10) con stato 0x2a o 0x8a. Ciò significa che gli host stanno interrompendo gli I/O di scrittura:
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>10/01/2019 19:39:09.68: stdf/10 scsi tmf [attività interrotta] su fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>10/01/2019 19:39:09.68: stdf/10 scsi tmf [interrompi attività] su fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>10/01/2019 19:39:09.68: stdf/10 scsi tmf [interrompi attività] su fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormienteQCnt 0 abilitatoQCnt 0 status 2a00000000000605:400ac80000002
Flusso di timeout back-end (eventi scsi/140) sul volume di storage corrispondente al volume virtuale presentato agli host interessati:
firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304763:<4>10/01/2019 19:39:09.68: timeout 0x7ec67ce41278 comando scsi/140 scsi, codice operativo 0x2a luid VPD83T3:6000000000000000000000000000000000000 nexus x fcp i 0xc0014487873b8800 t 0x5006016c47e02548 0x000f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304764:<4>2019/01/10 19:39:09.68: scsi/140 comando scsi 0x7ec67b9c99f0 timeout, codice operativo 0x2a luid VPD83T3:600000000000000000000000000000000000 nexus x fcp i 0xc0014487873b8800 t 0x5006016c47e02548 0x004f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304765:<4>10/01/2019 19:39:09.68: timeout del 0x7ec67f032f90 comando scsi/140 scsi, codice operativo 0x2a luid VPD83T3:600000000000000000000000000 nexus x fcp i 0xc0014487873b8900 t 0x5006016d47e02548 0x000f0000000000
È inoltre possibile osservare eventi di riduzione delle prestazioni (eventi amf/249) sui volumi di storage interessati.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>10/01/2019 19:39:09.6: amf/249 Le prestazioni del sop_xxxx AMF sono peggiorate. La latenza media di I/O di scrittura è aumentata da 0,0 millisecondi a 216,197 millisecondi, superando il limite accettabile di 200 millisecondi.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>10/01/2019 19:39:09.6: amf/249 Le prestazioni di sop_xxxx AMF sono peggiorate. La latenza media di I/O di scrittura è aumentata da 0,0 millisecondi a 216,197 millisecondi, superando il limite accettabile di 200 millisecondi.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>10/01/2019 19:39:09.6: amf/249 Le prestazioni di sop_xxxx AMF sono peggiorate. La latenza media di I/O di scrittura è aumentata da 0,0 millisecondi a 216,197 millisecondi, superando il limite accettabile di 200 millisecondi.
Un gemello di mirroring RAID-1 basato su un volume di storage con prestazioni scarse può ridurre le prestazioni dell'intero dispositivo RAID-1 e aumentare le latenze di I/O per le applicazioni che utilizzano questo dispositivo. Ciò è dovuto al fatto che gli I/O di scrittura vengono scritti solo dopo essere stati riconosciuti su entrambi i lati (uno dei quali è il segmento con prestazioni scarse)
Causa
Risoluzione
VPlexcli:/>device mirror-isolation enable
VPlexcli:/>device mirror-isolation show
Cluster Enabled Auto unisolation interval Isolation
unisolation interval --------- ------- ---------------- ------------------ --------------------
cluster-1 true true 60 14400
cluster-2 true true 60 14400
Questa funzione isolerà automaticamente [cessa di fare I/O per] i segmenti RAID-1 con prestazioni scarse. È abilitata per cluster.
Pro:
- Funzionalità automatica in grado di isolare rapidamente le gambe con scarse prestazioni dopo che il problema si è verificato [di solito entro pochi minuti]
- Quando un dispositivo diventa non isolato, la ricostruzione avviene automaticamente e ricostruisce solo le modifiche che si sono verificate mentre il segmento del dispositivo era isolato. Di solito bastano pochi minuti per risincronizzare
- La funzione può essere abilitata e disabilitata in modo semplice e rapido
- Mentre un segmento del dispositivo è isolato, il dispositivo di primo livello non ha più ridondanza
- Una volta isolato un segmento del dispositivo, VPLEX non verificherà di disisolarlo per 4 ore [in questo modo si evita la situazione in cui problemi di prestazioni intermittenti causano un impatto intermittente sulle prestazioni]
Per ulteriori informazioni sulla funzione di isolamento mirror, fare riferimento alla Guida dell'amministratore di VPLEX.
L'utilizzo dell'isolamento del mirror allevia solo i problemi di prestazioni, arrestando così l'impatto sulle prestazioni. Tuttavia, la root cause del peggioramento delle prestazioni deve essere analizzata ulteriormente. I team di array back-end e fabric back-end devono essere coinvolti per esaminare ulteriormente la questione.
NOTA:
fare riferimento anche all'articolo KB 530520, "VPLEX: I guasti dei singoli componenti nei controller fabric o array possono causare una non disponibilità dei dati continua delle prestazioni sugli host che accedono allo storage tramite VPLEX"
Informazioni aggiuntive
| https://downloads.dell.com/TranslatedPDF/PT-BR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ZH-CN_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/AR-EG_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ES_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/NL_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/PT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/RU_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/SV_KB530258.pdf |