VPLEX: Lagerdiskenhed i kritisk fejltilstand pga. scsi-kontrolbetingelse B/44/00 fra storage-array
Summary: VPLEX markerer, at disken er død pga. scsi-registreringskode B/44/00 fra det underliggende storagesystem.
Symptoms
VPLEX storage-diskenheden er i en kritisk fejl-tilstand, og den underliggende diskenhed er sund på systemsiden.
Eksempel på output fra cli-kommando: ll /clusters/cluster-1/storage-elements/storage-volumes/<storage-volume name>
VPlexcli:/> ll /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000 /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 65798400 block-size 4K capacity 251G description - free-chunks [] health-indications [hardware dead] health-state critical-failure <<-- io-status dead itls 0x50001442607de710/0x5000097378028844/80, 0x50001442607de710/0x50000973780288c4/80, 0x50001442607de711/0x5000097378028844/80, 0x50001442607de711/0x50000973780288c4/80, 0x50001442707de710/0x5000097378028844/80, 0x50001442707de710/0x50000973780288c4/80, 0x50001442707de711/0x5000097378028844/80, 0x50001442707de711/0x50000973780288c4/80, 0x50001442a0100410/0x5000097378028844/80, 0x50001442a0100410/0x50000973780288c4/80, ... (16 total) largest-free-chunk 0B locality - operational-status error provision-type legacy storage-array-name EMC-SYMMETRIX-XXXXXXXXX storage-volumetype normal system-id VPD83T3:60000097000000000000000000000000 thin-capable false thin-rebuild true total-free-space 0B underlying-storage-block-size 512 use unusable used-by [extent_Symm1234_0000_1] vendor-specific-name EMC
Lagervolumen i kritisk svigttilstand
VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State ---------------------------------------- --------- ------------------ ---------------- Symm1234_0000 dead error critical-failure <<--
Et eksempel på et uddrag fra Dial Home, der fremhæver den logiske enhed, der døde:
<EventData><![CDATA[disk VPD83T3:60000970000000000000000000000000: disk died, no mirror exists
Hvis denne lagerdiskenhed ikke er en del af en distribueret enhed, mister værten adgangen til denne virtuelle diskenhed, hvilket forårsager en situation med datautilgængelighed.
VPlex-firmwarelogfiler skildrer streaming af scsi/27-hændelser med SCSI Sense Code-nøglen 0xb asc 0x44 ascq 0x0 (B/44/00), som kan oversættes til INTERN MÅLFEJL.
Eksempel på scsi/27-forekomster fra firmware.log
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298782:<6>2016/11/11 06:50:57.94: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298783:<6>2016/11/11 06:50:58.00: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298784:<6>2016/11/11 06:50:58.16: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298785:<6>2016/11/11 06:50:58.30: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0
Enogtyve nye forsøg blev udført, og lagerdiskenheden er markeret som død på grund af kontinuerlige skrivefejl.
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298797:<4>2016/11/11 06:51:01.42: amf/45 disk VPD83T3:60000097000000000000000000000000: write failure: marking this in-use disk dead 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298798:<2>2016/11/11 06:51:01.42: amf/97 disk VPD83T3:60000097000000000000000000000000: disk died, no mirror exists
Cause
Storage-Array returnerer B/44/00 for en Write I/O-anmodning (0x2a), systemet kan ikke opfylde I/O-anmodningen og svarer med kontrolbetingelse B/44/00 (INTERN MÅLFEJL)
Hvis den underliggende lagerdiskenhed er en VMAX-diskenhed, kan der opstå I/O-fejl af nedenstående årsager:
Årsagen til, at VMAX afbrød IO, oplyses ikke til VPlex. Der er mange grunde til, at der opstår en intern målfejl, og den kan skyldes en meget bred vifte af kilder.
Resolution
Det storagesystem, der sender scsi-kontrolbetingelsen B/44/00 til VPLEX, skal undersøges af leverandøren af det pågældende system. Dette problem udløses af, at systemet ikke kan servicere skrive-I/O-anmodningen på grund af et problem med "intern målfejl" på storage-arrayet.
Hvis det underliggende system er et VMAX-system, kan et system sende scsi-kontrolbetingelsen "B/44/00" af flere årsager.
Følgende cli-kommando kan køres på VPLEX-administrationsserveren for at få en liste over logiske enheder, der er påvirket af B/44/00-kontrolbetingelsen:
grep "scsi/27" firmware.log* | grep 'key 0xb' |awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
Eksempel:
service@ManagementServer:~> grep "scsi/27" firmware.log* | grep 'key 0xb' | awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
103474 scsi/27 VPD83T3:60000097000000000000000000000000 key 0xb asc 0x44 ascq 0x0
45254 scsi/27 VPD83T3:60000097000000000000000000000001 key 0xb asc 0x44 ascq 0x0
32908 scsi/27 VPD83T3:60000097000000000000000000000002 key 0xb asc 0x44 ascq 0x0
25581 scsi/27 VPD83T3:60000097000000000000000000000003 key 0xb asc 0x44 ascq 0x0
21043 scsi/27 VPD83T3:60000097000000000000000000000004 key 0xb asc 0x44 ascq 0x0
10809 scsi/27 VPD83T3:60000097000000000000000000000005 key 0xb asc 0x44 ascq 0x0
10651 scsi/27 VPD83T3:60000097000000000000000000000006 key 0xb asc 0x44 ascq 0x0
Hvis dette er et ikke-EMC-system, skal du kontakte den respektive systemleverandør for at løse det problem, der findes på storage-arrayet.
Additional Information
Dette er ikke et VPlex-problem, det kan enten være et backend-system eller et strukturproblem.
Storage-Array-teamet, tilslutningsmuligheder eller begge skal være engageret.