VPLEX: Svår skrivlatens på VPlex-distribuerade enheter på grund av prestandaproblem i serverdelen
Summary: Den här artikeln handlar om hur man använder funktionen för speglingsisolering under problem med backend-prestanda på VPLEX RAID-1-enheter.
Symptoms
Värdar upplever allvarlig skrivfördröjning, vilket kan orsaka en prestanda-DU.
Från VPlex-sidan kan det finnas en ström av värdavbrott (stdf/10-händelser) med statusen 0x2a eller 0x8a. Det innebär att värdarna avbryter skrivning av IO:er:
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Avbryt uppgift] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a000000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Avbryt uppgift] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a000000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Avbryt uppgift] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 vilandeQCnt 0 enabledQCnt 0 status 2a00000000000605:400ac80000002
Ström av tidsgränser för serverdelen (scsi/140-händelser) mot lagringsvolymen som motsvarar den virtuella volym som presenteras för de berörda värdarna:
firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304763:<4>2019/01/10 19:39:09.68: scsi/140 Scsi-kommando 0x7ec67ce41278 timeout, opcode 0x2a luid VPD83T3:600 304764<> 20181019000922 0x5006016c47e02548 0x000f000000000000 firmware.log 0xc0014487873b8800 000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002019/01/10 19:39:09.68: scsi/140 Scsi-kommando 0x7ec67b9c99f0 timeout, opcode 0x2a luid VPD83T3::6000000 0x5006016d47e02548 0xc0014487873b8900 VPD83T3 0x2a 0x7ec67f032f90 304765<> 20181019000922 0x5006016c47e02548 0x004f000000000000 firmware.log 0xc0014487873b8800 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0x000f0000000000
Prestandaförsämringshändelser kan också observeras (amf/249-händelser) mot de påverkade lagringsvolymerna.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx prestanda har försämrats. Den genomsnittliga skriv-I/O-svarstiden har ökat från 0,0 millisekunder till 216,197 millisekunder, vilket är över den acceptabla gränsen på 200 millisekunder.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx prestanda har försämrats. Den genomsnittliga skriv-I/O-svarstiden har ökat från 0,0 millisekunder till 216,197 millisekunder, vilket är över den acceptabla gränsen på 200 millisekunder.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx prestanda har försämrats. Den genomsnittliga skriv-I/O-svarstiden har ökat från 0,0 millisekunder till 216,197 millisekunder, vilket är över den acceptabla gränsen på 200 millisekunder.
En RAID-1-spegling som bygger på en dåligt presterande lagringsvolym kan sänka prestandan för hela RAID-1-enheten och öka I/O-latensen för de program som använder enheten. Detta beror på det faktum att skriv-I/O skrivs först efter att ha bekräftats på båda benen (en av dem är det dåligt presterande benet)
Cause
Resolution
VPlexcli:/>enhetsspeglingsisolering aktivera
VPlexcli:/>enhetsspeglingsisolering visa
kluster aktiverat Automatisk avisolering Isoleringsintervall Oisolering
--------- ------- ---------------- ------------------ --------------------
kluster-1 sant sant 60 14400
kluster-2 sant sant 60 14400
Funktionen isolerar automatiskt [sluta göra I/O till] dåligt presterande RAID-1-sträckor. Den är aktiverad per kluster.
Proffsen:
- Automatisk funktion som kan isolera dåligt presterande ben snabbt efter att problemet uppstår [vanligtvis inom några minuter]
- När en enhet blir oisolerad sker återskapandet automatiskt och återskapas endast de ändringar som inträffade när enhetsbenet isolerades. Det tar vanligtvis bara några minuter att synkronisera om
- Funktionen kan enkelt och snabbt aktiveras och inaktiveras
- När ett enhetsben är isolerat har enheten på den översta nivån inte längre redundans
- När ett enhetsben har isolerats kommer VPLEX inte att kontrollera att benet ska avisoleras på 4 timmar [på så sätt undviks en situation där intermittenta prestandaproblem orsakar intermittent prestandapåverkan]
Mer information om funktionen för speglingsisolering finns i VPLEX-adminmanualen.
Att använda speglingsisolering lindrar bara prestandaproblemen, vilket stoppar prestandapåverkan. Grundorsaken till prestandaförsämringen måste dock undersökas ytterligare. Teamen för backend-matris och backend-infrastruktur bör anlitas för att undersöka detta ytterligare.
OBS!
Se även KB 530520, "VPLEX: Fel på enskilda komponenter i strukturen eller matrisstyrenheterna kan leda till kontinuerlig prestandabelastning på värdar som får åtkomst till lagring via VPLEX"
Additional Information
| https://downloads.dell.com/TranslatedPDF/PT-BR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ZH-CN_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/AR-EG_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ES_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/NL_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/PT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/RU_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/SV_KB530258.pdf |