VPLEX: Wolumin pamięci masowej w stanie krytycznej awarii z powodu warunku sprawdzania scsi B/44/00 z macierzy pamięci masowej
Summary: VPLEX oznacza dysk jako martwy z powodu kodu wykrywania scsi B/44/00 z bazowej macierzy pamięci masowej.
Symptoms
Wolumin pamięci masowej VPLEX jest w stanie krytycznej awarii, a wolumin bazowy jest w dobrej kondycji po stronie macierzy.
Przykładowe dane wyjściowe z polecenia interfejsu wiersza polecenia: ll /clusters/cluster-1/storage-elements/storage-volumes/<storage-volume name>
VPlexcli:/> ll /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000 /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 65798400 block-size 4K capacity 251G description - free-chunks [] health-indications [hardware dead] health-state critical-failure <<-- io-status dead itls 0x50001442607de710/0x5000097378028844/80, 0x50001442607de710/0x50000973780288c4/80, 0x50001442607de711/0x5000097378028844/80, 0x50001442607de711/0x50000973780288c4/80, 0x50001442707de710/0x5000097378028844/80, 0x50001442707de710/0x50000973780288c4/80, 0x50001442707de711/0x5000097378028844/80, 0x50001442707de711/0x50000973780288c4/80, 0x50001442a0100410/0x5000097378028844/80, 0x50001442a0100410/0x50000973780288c4/80, ... (16 total) largest-free-chunk 0B locality - operational-status error provision-type legacy storage-array-name EMC-SYMMETRIX-XXXXXXXXX storage-volumetype normal system-id VPD83T3:60000097000000000000000000000000 thin-capable false thin-rebuild true total-free-space 0B underlying-storage-block-size 512 use unusable used-by [extent_Symm1234_0000_1] vendor-specific-name EMC
Wolumin pamięci masowej w stanie krytycznym awarii
VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State ---------------------------------------- --------- ------------------ ---------------- Symm1234_0000 dead error critical-failure <<--
Przykładowy fragment z Dial Home, który podkreśla jednostkę logiczną, która umarła:
<EventData><![CDATA[disk VPD83T3:60000970000000000000000000000000: disk died, no mirror exists
Jeśli ten wolumin pamięci masowej nie jest częścią urządzenia rozproszonego, host utraci dostęp do tego woluminu wirtualnego, powodując niedostępność danych.
Dzienniki oprogramowania wewnętrznego VPlex przedstawiają zdarzenia scsi/27 przesyłania strumieniowego z kluczem SCSI Sense Code 0xb asc 0x44 ascq 0x0 (B/44/00), co przekłada się na WEWNĘTRZNĄ AWARIĘ DOCELOWĄ.
Przykładowe wystąpienia scsi/27 z firmware.log
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298782:<6>2016/11/11 06:50:57.94: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298783:<6>2016/11/11 06:50:58.00: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298784:<6>2016/11/11 06:50:58.16: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298785:<6>2016/11/11 06:50:58.30: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0
Wykonano dwadzieścia jeden ponownych prób, a wolumin pamięci masowej został oznaczony jako martwy z powodu ciągłych błędów zapisu.
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298797:<4>2016/11/11 06:51:01.42: amf/45 disk VPD83T3:60000097000000000000000000000000: write failure: marking this in-use disk dead 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298798:<2>2016/11/11 06:51:01.42: amf/97 disk VPD83T3:60000097000000000000000000000000: disk died, no mirror exists
Cause
Macierz pamięci masowej zwraca wartość B/44/00 dla żądania zapisu we/wy (0x2a), macierz nie jest w stanie obsłużyć żądania we/wy i odpowiada warunkiem sprawdzania B/44/00 (BŁĄD CELU WEWNĘTRZNEGO)
Jeśli podstawowy wolumin pamięci masowej jest woluminem VMAX, awarie we/wy mogą wystąpić z poniższych powodów:
Powód, dla którego VMAX przerwał operacje we/wy, nie jest podawany VPlex. Istnieje wiele przyczyn awarii celu wewnętrznego, które mogą być spowodowane przez bardzo szeroki zakres źródeł.
Resolution
Macierz pamięci masowej, która wysyła warunek sprawdzania scsi, B/44/00, do VPLEX, musi zostać zbadana przez odpowiedniego dostawcę macierzy. Ten problem jest wywoływany przez macierz, która nie może obsłużyć żądania we/wy zapisu z powodu problemu "Internal Target Failure" w macierzy pamięci masowej.
Jeśli macierz bazowa jest macierzą VMAX, macierz może wysłać warunek sprawdzenia scsi "B/44/00" z kilku powodów.
Następujące polecenie wiersza poleceń można uruchomić na serwerze VPLEX Management-Server, aby uzyskać listę jednostek logicznych, których dotyczy warunek B/44/00:
grep "scsi/27" firmware.log* | grep 'key 0xb' |awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
Przykład:
service@ManagementServer:~> grep "scsi/27" firmware.log* | grep 'key 0xb' | awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
103474 scsi/27 VPD83T3:60000097000000000000000000000000 key 0xb asc 0x44 ascq 0x0
45254 scsi/27 VPD83T3:60000097000000000000000000000001 key 0xb asc 0x44 ascq 0x0
32908 scsi/27 VPD83T3:60000097000000000000000000000002 key 0xb asc 0x44 ascq 0x0
25581 scsi/27 VPD83T3:60000097000000000000000000000003 key 0xb asc 0x44 ascq 0x0
21043 scsi/27 VPD83T3:60000097000000000000000000000004 key 0xb asc 0x44 ascq 0x0
10809 scsi/27 VPD83T3:60000097000000000000000000000005 key 0xb asc 0x44 ascq 0x0
10651 scsi/27 VPD83T3:60000097000000000000000000000006 key 0xb asc 0x44 ascq 0x0
Jeśli jest to macierz innej niż EMC, skontaktuj się z dostawcą macierzy w celu rozwiązania problemu z macierzą.
Additional Information
To nie jest problem VPlex. Może to być problem z macierzą zaplecza lub strukturą.
Musi być zaangażowany zespół macierzy pamięci masowej, łączność lub obie te grupy.