VPLEX: El volumen de almacenamiento se encuentra en un estado de falla crítica debido a la condición de comprobación de scsi B/44/00 del arreglo de almacenamiento
Summary: VPLEX marca el disco como inactivo debido al código de detección de scsi B/44/00 del arreglo de almacenamiento subyacente.
Symptoms
El volumen de almacenamiento de VPLEX se encuentra en un estado de falla crítica y el volumen subyacente está en buen estado en el lado del arreglo.
Ejemplo de salida del comando cli: ll /clusters/cluster-1/storage-elements/storage-volumes/<storage-volume name>
VPlexcli:/> ll /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000 /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 65798400 block-size 4K capacity 251G description - free-chunks [] health-indications [hardware dead] health-state critical-failure <<-- io-status dead itls 0x50001442607de710/0x5000097378028844/80, 0x50001442607de710/0x50000973780288c4/80, 0x50001442607de711/0x5000097378028844/80, 0x50001442607de711/0x50000973780288c4/80, 0x50001442707de710/0x5000097378028844/80, 0x50001442707de710/0x50000973780288c4/80, 0x50001442707de711/0x5000097378028844/80, 0x50001442707de711/0x50000973780288c4/80, 0x50001442a0100410/0x5000097378028844/80, 0x50001442a0100410/0x50000973780288c4/80, ... (16 total) largest-free-chunk 0B locality - operational-status error provision-type legacy storage-array-name EMC-SYMMETRIX-XXXXXXXXX storage-volumetype normal system-id VPD83T3:60000097000000000000000000000000 thin-capable false thin-rebuild true total-free-space 0B underlying-storage-block-size 512 use unusable used-by [extent_Symm1234_0000_1] vendor-specific-name EMC
Volumen de almacenamiento en estado de falla crítica
VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State ---------------------------------------- --------- ------------------ ---------------- Symm1234_0000 dead error critical-failure <<--
Un extracto de muestra de Dial Home que destaca la unidad lógica que murió:
<EventData><![CDATA[disk VPD83T3:60000970000000000000000000000000: disk died, no mirror exists
Si este volumen de almacenamiento no forma parte de un dispositivo distribuido, el host pierde acceso a este volumen virtual y provoca una situación de falta de disponibilidad de datos.
Los registros de firmware de VPLEX muestran el streaming de eventos scsi/27 con la clave de código de detección de SCSI 0xb asc 0x44 ascq 0x0 (B/44/00), lo que se traduce en FALLA DE DESTINO INTERNO.
Ejemplos de instancias de scsi/27 de firmware.log
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298782:<6>2016/11/11 06:50:57.94: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298783:<6>2016/11/11 06:50:58.00: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298784:<6>2016/11/11 06:50:58.16: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298785:<6>2016/11/11 06:50:58.30: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0
Se realizan 21 reintentos y el volumen de almacenamiento se marca como inactivo debido a fallas de escritura continuas.
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298797:<4>2016/11/11 06:51:01.42: amf/45 disk VPD83T3:60000097000000000000000000000000: write failure: marking this in-use disk dead 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298798:<2>2016/11/11 06:51:01.42: amf/97 disk VPD83T3:60000097000000000000000000000000: disk died, no mirror exists
Cause
El arreglo de almacenamiento devuelve B/44/00 para una solicitud de I/O de escritura (0x2a), el arreglo no puede atender la solicitud de I/O y responde con la condición de comprobación B/44/00 (FALLA DE DESTINO INTERNO)
Si el volumen de almacenamiento subyacente es un volumen VMAX, pueden producirse fallas de I/O por los motivos que se indican a continuación:
El motivo por el cual VMAX anuló la I/O no se proporciona al VPLEX. Hay muchas razones por las que se producirá una falla de destino interno y podría deberse a una amplia gama de orígenes.
Resolution
El proveedor del arreglo correspondiente debe investigar el arreglo de almacenamiento que envía la condición de comprobación de scsi, B/44/00, a VPLEX. Este problema se desencadena debido a que el arreglo no puede atender la solicitud de I/O de escritura debido a un problema de "falla de destino interno" en el arreglo de almacenamiento.
Si el arreglo subyacente es un arreglo VMAX, un arreglo puede enviar la condición de comprobación de scsi "B/44/00" por varios motivos.
El siguiente comando de la CLI se puede ejecutar en el servidor de administración de VPLEX para obtener una lista de las unidades lógicas afectadas por la condición de comprobación B/44/00:
grep "scsi/27" firmware.log* | grep 'key 0xb' |awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
Ejemplo:
service@ManagementServer:~> grep "scsi/27" firmware.log* | grep 'key 0xb' | awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
103474 scsi/27 VPD83T3:60000097000000000000000000000000 key 0xb asc 0x44 ascq 0x0
45254 scsi/27 VPD83T3:60000097000000000000000000000001 key 0xb asc 0x44 ascq 0x0
32908 scsi/27 VPD83T3:60000097000000000000000000000002 key 0xb asc 0x44 ascq 0x0
25581 scsi/27 VPD83T3:60000097000000000000000000000003 key 0xb asc 0x44 ascq 0x0
21043 scsi/27 VPD83T3:60000097000000000000000000000004 key 0xb asc 0x44 ascq 0x0
10809 scsi/27 VPD83T3:60000097000000000000000000000005 key 0xb asc 0x44 ascq 0x0
10651 scsi/27 VPD83T3:60000097000000000000000000000006 key 0xb asc 0x44 ascq 0x0
Si se trata de un arreglo que no es de EMC, comuníquese con el proveedor del arreglo correspondiente para resolver el problema existente en el arreglo de almacenamiento.
Additional Information
Este no es un problema de VPLEX, podría ser un problema del arreglo de back-end o de fabric.
Se debe involucrar al equipo de arreglo de almacenamiento, conectividad o ambos.