VPLEX: Volume de armazenamento em estado crítico-falha devido à condição de verificação SCSI B/44/00 do storage array
Summary: O VPLEX marca o disco como inativo devido ao código de detecção scsi B/44/00 do storage array subjacente.
Symptoms
O volume de armazenamento do VPLEX está em um estado de falha crítica e o volume subjacente está íntegro no lado do array.
Exemplo de resultado do comando da CLI: ll /clusters/cluster-1/storage-elements/storage-volumes/<storage-volume name>
VPlexcli:/> ll /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000 /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 65798400 block-size 4K capacity 251G description - free-chunks [] health-indications [hardware dead] health-state critical-failure <<-- io-status dead itls 0x50001442607de710/0x5000097378028844/80, 0x50001442607de710/0x50000973780288c4/80, 0x50001442607de711/0x5000097378028844/80, 0x50001442607de711/0x50000973780288c4/80, 0x50001442707de710/0x5000097378028844/80, 0x50001442707de710/0x50000973780288c4/80, 0x50001442707de711/0x5000097378028844/80, 0x50001442707de711/0x50000973780288c4/80, 0x50001442a0100410/0x5000097378028844/80, 0x50001442a0100410/0x50000973780288c4/80, ... (16 total) largest-free-chunk 0B locality - operational-status error provision-type legacy storage-array-name EMC-SYMMETRIX-XXXXXXXXX storage-volumetype normal system-id VPD83T3:60000097000000000000000000000000 thin-capable false thin-rebuild true total-free-space 0B underlying-storage-block-size 512 use unusable used-by [extent_Symm1234_0000_1] vendor-specific-name EMC
Volume de armazenamento em estado de falha crítica
VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State ---------------------------------------- --------- ------------------ ---------------- Symm1234_0000 dead error critical-failure <<--
Um exemplo de trecho do Dial Home que destaca a unidade lógica que morreu:
<EventData><![CDATA[disk VPD83T3:60000970000000000000000000000000: disk died, no mirror exists
Se esse volume de armazenamento não fizer parte de um dispositivo distribuído, o host perderá o acesso a esse Virtual Volume, o que causará uma situação de indisponibilidade de dados.
Os registros de firmware do VPlex retratam eventos de streaming scsi/27 com a chave SCSI Sense Code 0xb asc 0x44 ascq 0x0 (B/44/00), que é traduzida como FALHA DE DESTINO INTERNO.
Exemplo de instâncias scsi/27 de firmware.log
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298782:<6>2016/11/11 06:50:57.94: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298783:<6>2016/11/11 06:50:58.00: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298784:<6>2016/11/11 06:50:58.16: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298785:<6>2016/11/11 06:50:58.30: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0
Vinte e uma tentativas executadas e o volume de armazenamento é marcado como inativo devido a falhas contínuas de gravação.
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298797:<4>2016/11/11 06:51:01.42: amf/45 disk VPD83T3:60000097000000000000000000000000: write failure: marking this in-use disk dead 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298798:<2>2016/11/11 06:51:01.42: amf/97 disk VPD83T3:60000097000000000000000000000000: disk died, no mirror exists
Cause
O storage array retorna B/44/00 para uma solicitação de E/S de gravação (0x2a), o array não consegue atender à solicitação de E/S e responde com a condição de verificação B/44/00 (FALHA NO DESTINO INTERNO)
Se o volume de armazenamento subjacente for um volume VMAX, as falhas de E/S poderão ocorrer pelos motivos descritos abaixo:
O motivo pelo qual o VMAX abortou a E/S não é fornecido ao VPlex. Há muitas razões pelas quais ocorrerá uma falha de destino interno, que pode ser causada por uma ampla variedade de fontes.
Resolution
O storage array que está enviando a condição de verificação scsi, B/44/00, ao VPLEX deve ser investigado pelo respectivo fornecedor do array. Esse problema é acionado pela incapacidade do array de atender à solicitação de E/S de gravação devido a um problema de "falha no destino interno" no storage array.
Se o array subjacente for um array VMAX, um array poderá enviar a condição de verificação scsi "B/44/00" por vários motivos.
O seguinte comando da CLI pode ser executado no VPLEX Management-Server para obter uma lista de unidades lógicas afetadas pela condição de verificação B/44/00:
grep "scsi/27" firmware.log* | grep 'key 0xb' |awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
Exemplo:
service@ManagementServer:~> grep "scsi/27" firmware.log* | grep 'key 0xb' | awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
103474 scsi/27 VPD83T3:60000097000000000000000000000000 key 0xb asc 0x44 ascq 0x0
45254 scsi/27 VPD83T3:60000097000000000000000000000001 key 0xb asc 0x44 ascq 0x0
32908 scsi/27 VPD83T3:60000097000000000000000000000002 key 0xb asc 0x44 ascq 0x0
25581 scsi/27 VPD83T3:60000097000000000000000000000003 key 0xb asc 0x44 ascq 0x0
21043 scsi/27 VPD83T3:60000097000000000000000000000004 key 0xb asc 0x44 ascq 0x0
10809 scsi/27 VPD83T3:60000097000000000000000000000005 key 0xb asc 0x44 ascq 0x0
10651 scsi/27 VPD83T3:60000097000000000000000000000006 key 0xb asc 0x44 ascq 0x0
Se for um array não EMC, entre em contato com o respectivo fornecedor de array para resolver o problema existente no storage array.
Additional Information
Esse não é um problema do VPlex, pode ser um problema de array de back-end ou de fabric.
A equipe de storage array, a conectividade ou ambas devem estar envolvidas.