VPLEX: Disk označený jako hardware je mrtvý kvůli podmínce kontroly SCSI 3/11/0 z diskového pole
Summary: VPLEX označí disk jako nefunkční kvůli kódu snímání scsi 3/11/0 ze základního diskového pole.
Symptoms
Tato událost se spustí, když VPLEX provede požadavek na čtení do základní jednotky LUN pole úložišť a pole nemůže obsluhovat I/O na tomto bloku jednotky LUN, což spustí stav kontroly 3/11/0 (vadný blok na poli)
K tomu obvykle dochází v situacích s intenzivním čtením-I/O, například:
- Rozsah VPLEX / migrace zařízení
- Operace zálohování
- Kontroly integrity databáze
Svazek úložiště VPLEX je označen jako "hardware-dead", ale v rozhraní pole úložišť se zobrazuje v dobrém stavu.
Ukázkový výstup příkazu cli ll /clusters/cluster-2/storage-elements/storage-volumes/storage-volume name>
VPlexcli:/> ll /clusters/cluster-2/storage-elements/storage-volumes/VNX_LUN_25
/clusters/cluster-2/storage-elements/storage-volumes/VNX_LUN_25:
Name Value
----------------------------- ------------------------------------------------
application-consistent false
block-count 1073741824
block-size 4K
capacity 4T
description -
free-chunks []
health-indications [hardware dead] <<
health-state critical-failure <<
io-status dead <<
itls 0x50001442a03c0810/0x5006016b08603879/9,
0x50001442a03c0811/0x5006016308603879/9,
largest-free-chunk 0B
locality -
operational-status error <<
provision-type legacy
storage-array-name EMC-CLARiiON-123456789
storage-volumetype normal
system-id VPD83T3:xxxxxxxxxxxxxxxxxxxxx
thin-capable false
thin-rebuild true
total-free-space 0B
underlying-storage-block-size 512
use unusable <<
used-by [extent_VNX_LUN_25]
vendor-specific-name DGC
Migrace zařízení/rozsahu VPLEX (úloha mobility) se zasekne na určitém procentu.
Ukázkový výstup příkazu cli ll data-migrations/device-migrations/<device_migration_name>
VPlexcli:/> ll data-migrations/device-migrations/D__Migrate_LUN_1
/data-migrations/device-migrations/D__Migrate_LUN_1:
Name Value
--------------- ----------------------------
from-cluster cluster-1
percentage-done 7
source device_VNX_LUN25_1
source-exported -
start-time -
status error <<
target device_SYMM_DEV1234_1
target-exported -
to-cluster cluster-2
transfer-size 2M
type full
Hostitel vidí, že úložiště VPLEX přejde do režimu offline nebo je označeno jako mrtvé a úložný svazek VPLEX je také označen jako kriticky nefunkční nebo nefunkční hardware.
Sample data, jak je uvedeno v protokolu firmwaru,amf/45 disk VPD83T3:xxxxxxxxxxxxxxx: read failure: marking this in-use disk dead
Protokoly firmwaru VPLEX zobrazují streamování nebo přerušované SCSI/27 (kontrolní podmínky) s položkami kódu SCSI Sense pro 3/11/0, což v překladu znamená "Medium Error - unrecovered read error"
Ukázkový výstup, jak je uvedeno v protokolu firmwaru během incidentu,2016/06/09 02:46:23.67: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0
2016/06/09 02:46:23.68: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0
2016/06/09 02:46:23.69: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0
Pro potvrzení tohoto problému budou vždy platit následující:key = 0x3asc = 0x11ascq = 0x0
Cause
Když VPLEX odešle požadavek na čtení I/O (0x28) do diskového pole, pole není schopno úspěšně obsloužit požadavek I/O a odpoví kontrolní podmínkou 3/11/0 pro "Unrerecovery Read error".
VPLEX se pokusí číst z chybného bloku na diskovém poli, a jelikož diskové pole není schopné tento vstup/výstup obsloužit, VPLEX označí úložiště jako mrtvé.
To není specifické pro pole ani kód pole.
Příčina je externí pro VPLEX a jedná se o problém pole úložišť s jednotkou LUN.
Resolution
Pole úložišť, které odesílá kontrolní podmínku scsi 3/11/0 do VPLEX, musí být prozkoumáno příslušným dodavatelem pole. Tento problém je vyvolán tím, že pole není schopno zpracovat požadavek na vstup a výstup čtení kvůli problému "neobnovené čtení" v diskovém poli.
Musí být zapojena podpora VNX.
Spuštěním následujícího příkazu příkazového řádku na serveru pro správu VPLEX získáte seznam 50 nejčastějších logických jednotek, na které se vztahují podmínky kontroly 3/11/0:grep "key 0x3 " /var/log/VPlex/cli/firmware.log_* | awk '{print $3,$5,$18,$19,$26,$27,$28,$29}' | sort | uniq -c | sort -nr | head -50
Příklad:
service@ManagementServer:~> grep "key 0x3 " /var/log/VPlex/cli/firmware.log_* | awk '{print $3,$5,$18,$19,$26,$27,$28,$29}' | sort | uniq -c | sort -nr | head -50
388408 scsi/27 VPD83T3:60060160116632000000000000000001 key 0x3 asc 0x11 ascq 0x0
45135 scsi/27 VPD83T3:60060160116632000000000000000002 key 0x3 asc 0x11 ascq 0x0
44451 scsi/27 VPD83T3:60060160116632000000000000000003 key 0x3 asc 0x11 ascq 0x0
35412 scsi/27 VPD83T3:60060160116632000000000000000004 key 0x3 asc 0x11 ascq 0x0
30158 scsi/27 VPD83T3:60060160116632000000000000000005 key 0x3 asc 0x11 ascq 0x0
24589 scsi/27 VPD83T3:60060160116632000000000000000006 key 0x3 asc 0x11 ascq 0x0
21579 scsi/27 VPD83T3:60060160116632000000000000000007 key 0x3 asc 0x11 ascq 0x0
Pokud se jedná o pole bez výrobce EMC, požádejte o vyřešení problému s diskovým polem příslušného dodavatele pole.
Additional Information
Jedná se o problém s vrstvou bloku v diskovém poli a lze jej vyřešit pouze provedením akce v samotném poli úložišť.
Nejedná se o problém VPLEX, ale o to, že systém VPLEX hlásí příznak z backendového pole.
Použití "storage-volume resurrect --force" zde neplatí.
Tento příkaz vynutí, aby se mrtvý svazek úložiště zobrazil ve VPLEX jako "aktivní" bez ohledu na jeho aktuální stav IO nebo problémy v základním diskovém poli.
Tento příkaz vynutí, aby se svazek úložiště vrátil do režimu online, dokud nedojde k selhání dalšího vstupně-výstupního panelu v základním poli úložiště.
Když si hostitel vyžádá stejný blok dat, u kterého došlo k problému 3/11/0 na základním diskovém poli, svazek úložiště bude opět označen za mrtvý.
Jedná se o očekávané chování, nikoli o známku problému
s VPLEX.Prezentace problematického svazku úložiště přímo z pole úložišť hostiteli (obejití VPLEX) může hostiteli umožnit použít některá data. Tato akce však přímo prezentuje hostiteli možnost poškození dat. Hostitel má i nadále problémy se čtením z konkrétních bloků s problémem s kontrolní podmínkou 3/11/0.