VPLEX: Kraftig skriveventetid på distribuerede VPlex-enheder på grund af problemer med backend-ydeevnen
Summary: I denne artikel tales der om brug af spejlisoleringsfunktionen under problemer med backend-ydeevnen på VPLEX RAID-1-enheder.
Symptoms
Værter oplever alvorlig skriveventetid, som kan forårsage en ydeevne-DU.
Fra VPlex-siden kan der være en strøm af værtsafbrydelser (stdf/10-hændelser) med statussen 0x2a eller 0x8a. Det betyder, at værterne afbryder write IOs:
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Afbryd opgave] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a0000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Afbryd opgave] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a0000000000605:400ac80000002
128.221.252.67/cpu0/log:5988:W/"00601672b5b475554-2":126043:<6>2019/01/10 19:39:09.68: stdf/10 Scsi Tmf [Afbryd opgave] på fcp ITLQ: [10:00:00:00:C9:C9:AB:DC (0x10000000c9c9abdc) A0-FC00 (0x5000144260756500) 0x8000000000000 0x243] vol dd_vol taskElapsedTime(usec) 5339 dormantQCnt 0 enabledQCnt 0 status 2a0000000000605:400ac80000002
Stream af backend-timeouts (scsi/140-hændelser) i forhold til lagerdiskenheden, som svarer til den virtuelle diskenhed, der præsenteres for de berørte værter:
firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304763:<4>2019/01/10 19:39:09.68: scsi/140 Scsi kommando 0x7ec67ce41278 timeout, opcode 0x2a luid VPD83T3:6000000000000000000000000000000000 nexus x FCP i 0xc0014487873b8800 t 0x5006016c47e02548 0x000f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304764:<4>2019/01/10 19:39:09.68: scsi/140 Scsi kommando 0x7ec67b9c99f0 timeout, opcode 0x2a luid VPD83T3:6000000000000000000000000000000000 nexus x FCP i 0xc0014487873b8800 t 0x5006016c47e02548 0x004f000000000000 firmware.log_20181019000922:128.221.253.36/cpu0/log:5988:W/"0060166fc49615528-1":304765:<4>2019/01/10 19:39:09.68: scsi/140 Scsi kommando 0x7ec67f032f90 timeout, opcode 0x2a luid VPD83T3:6000000000000000000000000000000000000000000000 nexus x fcp i 0xc0014487873b8900 t 0x5006016d47e02548 0x000f0000000000
Hændelser med forringelse af ydeevnen kan også observeres (AMF/249-hændelser) mod de påvirkede lagerenheder.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 Amf sop_xxxx ydeevnen er forringet. Den gennemsnitlige skrive-I/O-ventetid steg fra 0,0 millisekunder til 216,197 millisekunder, hvilket er over den acceptable grænse på 200 millisekunder.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 AMF sop_xxxx ydeevnen er forringet. Den gennemsnitlige skrive-I/O-ventetid steg fra 0,0 millisekunder til 216,197 millisekunder, hvilket er over den acceptable grænse på 200 millisekunder.
128.221.253.67/cpu0/log:5988:W/"0060166fd1a610335-2":2359857:<4>2019/01/10 19:39:09.6: amf/249 AMF sop_xxxx ydeevnen er forringet. Den gennemsnitlige skrive-I/O-ventetid steg fra 0,0 millisekunder til 216,197 millisekunder, hvilket er over den acceptable grænse på 200 millisekunder.
En RAID-1-spejldel, der er bygget på en dårligt ydende lagerenhed, kan reducere ydeevnen for hele RAID-1-enheden og øge I/O-ventetiden for de programmer, der bruger denne enhed. Dette skyldes, at skrive-I/O'erne først skrives efter at være blevet anerkendt på begge ben (et af dem er det dårligt præsterende ben)
Cause
Resolution
VPlexcli:/>enhedsspejlisolering aktiver
VPlexcli:/>enhedsspejlisolationsshow
Klyngeaktiveret Automatisk afisolering Isolationsinterval uden isolationsinterval --------- ------- ---------------- ------------------ --------------------
klynge-1 true true 60 14400
klynge-2 true 60 14400
Denne funktion isolerer automatisk [stop med at gøre I/O'er til] dårligt ydende RAID-1-ben. Den aktiveres pr. klynge.
Fordele:
- Automatisk funktionalitet, der kan isolere dårligt ydende ben hurtigt efter problemet opstår [normalt inden for få minutter]
- Når en enhed ikke isoleres, sker genopbygningen automatisk og genopbygger kun de ændringer, der skete, mens enhedens ben var isoleret. Dette tager normalt kun et par minutter at synkronisere igen
- Funktionen kan nemt og hurtigt aktiveres og deaktiveres
- Mens et enhedsben er isoleret, har enheden på øverste niveau ikke længere redundans
- Når et enhedsben er isoleret, kontrollerer VPLEX ikke for at frigøre benet i 4 timer [dette undgår den situation, hvor intermitterende ydeevneproblemer forårsager intermitterende påvirkning af ydeevnen]
Du kan finde flere oplysninger om spejlisoleringsfunktionen i VPLEX-administrationsvejledningen.
Brug af spejlisolering lindrer kun ydelsesproblemerne og stopper dermed præstationspåvirkningen. Den grundlæggende årsag til forringelsen af ydeevnen skal dog undersøges nærmere. Backend-array- og backend-strukturholdene bør inddrages for at undersøge dette nærmere.
BEMÆRK:
Se også KB 530520, "VPLEX: Enkeltkomponentfejl i strukturen eller systemcontrollere kan føre til løbende ydeevne-DU på værter, der har adgang til storage via VPLEX"
Additional Information
| https://downloads.dell.com/TranslatedPDF/PT-BR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ZH-CN_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/AR-EG_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/ES_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/NL_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/PT_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/RU_KB530258.pdf |
| https://downloads.dell.com/TranslatedPDF/SV_KB530258.pdf |