VPLEX: Disk označený jako hardware je mrtvý kvůli podmínce kontroly SCSI 3/11/0 z diskového pole

Summary: VPLEX označí disk jako nefunkční kvůli kódu snímání scsi 3/11/0 ze základního diskového pole.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Tato událost se spustí, když VPLEX provede požadavek na čtení do základní jednotky LUN pole úložišť a pole nemůže obsluhovat I/O na tomto bloku jednotky LUN, což spustí stav kontroly 3/11/0 (vadný blok na poli)

K tomu obvykle dochází v situacích s intenzivním čtením-I/O, například:

  • Rozsah VPLEX / migrace zařízení
  • Operace zálohování
  • Kontroly integrity databáze


Svazek úložiště VPLEX je označen jako "hardware-dead", ale v rozhraní pole úložišť se zobrazuje v dobrém stavu.

Ukázkový výstup příkazu cli ll /clusters/cluster-2/storage-elements/storage-volumes/storage-volume name>
 

VPlexcli:/> ll /clusters/cluster-2/storage-elements/storage-volumes/VNX_LUN_25
/clusters/cluster-2/storage-elements/storage-volumes/VNX_LUN_25:
Name                           Value
-----------------------------  ------------------------------------------------
application-consistent         false

block-count                    1073741824
block-size                     4K
capacity                       4T
description                    -
free-chunks                    []
health-indications             [hardware dead] <<
health-state                   critical-failure <<
io-status                      dead <<
itls                           0x50001442a03c0810/0x5006016b08603879/9,
                               0x50001442a03c0811/0x5006016308603879/9,
largest-free-chunk             0B
locality                       -
operational-status             error <<
provision-type                 legacy
storage-array-name             EMC-CLARiiON-123456789
storage-volumetype             normal
system-id                      VPD83T3:xxxxxxxxxxxxxxxxxxxxx
thin-capable                   false
thin-rebuild                   true
total-free-space               0B
underlying-storage-block-size  512
use                            unusable <<
used-by                        [extent_VNX_LUN_25]
vendor-specific-name           DGC


Migrace zařízení/rozsahu VPLEX (úloha mobility) se zasekne na určitém procentu.

Ukázkový výstup příkazu cli ll data-migrations/device-migrations/<device_migration_name>
 

VPlexcli:/> ll data-migrations/device-migrations/D__Migrate_LUN_1
/data-migrations/device-migrations/D__Migrate_LUN_1:
Name             Value
---------------  ----------------------------
from-cluster     cluster-1
percentage-done  7
source           device_VNX_LUN25_1
source-exported  -
start-time       -
status           error <<
target           device_SYMM_DEV1234_1
target-exported  -
to-cluster       cluster-2
transfer-size    2M
type             full


Hostitel vidí, že úložiště VPLEX přejde do režimu offline nebo je označeno jako mrtvé a úložný svazek VPLEX je také označen jako kriticky nefunkční nebo nefunkční hardware.

Sample data, jak je uvedeno v protokolu firmwaru,
amf/45 disk VPD83T3:xxxxxxxxxxxxxxx: read failure: marking this in-use disk dead

Protokoly firmwaru VPLEX zobrazují streamování nebo přerušované SCSI/27 (kontrolní podmínky) s položkami kódu SCSI Sense pro 3/11/0, což v překladu znamená "Medium Error - unrecovered read error"

Ukázkový výstup, jak je uvedeno v protokolu firmwaru během incidentu,

2016/06/09 02:46:23.67: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0
2016/06/09 02:46:23.68: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0
2016/06/09 02:46:23.69: scsi/27 tgt VPD83T3:6006016011663200b058c25a984de511 cmd 0x28 status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0x3 info 0x0 alen 10 csi 0x0 asc 0x11 ascq 0x0 fru 0x0 sks 0x0


Pro potvrzení tohoto problému budou vždy platit následující:
key   = 0x3
asc   =  0x11
ascq = 0x0

Cause

Když VPLEX odešle požadavek na čtení I/O (0x28) do diskového pole, pole není schopno úspěšně obsloužit požadavek I/O a odpoví kontrolní podmínkou 3/11/0 pro "Unrerecovery Read error".

VPLEX se pokusí číst z chybného bloku na diskovém poli, a jelikož diskové pole není schopné tento vstup/výstup obsloužit, VPLEX označí úložiště jako mrtvé.

To není specifické pro pole ani kód pole.

Příčina je externí pro VPLEX a jedná se o problém pole úložišť s jednotkou LUN.

Resolution

Pole úložišť, které odesílá kontrolní podmínku scsi 3/11/0 do VPLEX, musí být prozkoumáno příslušným dodavatelem pole. Tento problém je vyvolán tím, že pole není schopno zpracovat požadavek na vstup a výstup čtení kvůli problému "neobnovené čtení" v diskovém poli.

Musí být zapojena podpora VNX.

Spuštěním následujícího příkazu příkazového řádku na serveru pro správu VPLEX získáte seznam 50 nejčastějších logických jednotek, na které se vztahují podmínky kontroly 3/11/0:

grep "key 0x3 " /var/log/VPlex/cli/firmware.log_* | awk '{print $3,$5,$18,$19,$26,$27,$28,$29}' | sort | uniq -c | sort -nr | head -50


Příklad:

service@ManagementServer:~> grep "key 0x3 " /var/log/VPlex/cli/firmware.log_* | awk '{print $3,$5,$18,$19,$26,$27,$28,$29}' | sort | uniq -c | sort -nr | head -50
    388408 scsi/27 VPD83T3:60060160116632000000000000000001 key 0x3 asc 0x11 ascq 0x0
   45135 scsi/27 VPD83T3:60060160116632000000000000000002 key 0x3 asc 0x11 ascq 0x0
   44451 scsi/27 VPD83T3:60060160116632000000000000000003 key 0x3 asc 0x11 ascq 0x0
   35412 scsi/27 VPD83T3:60060160116632000000000000000004 key 0x3 asc 0x11 ascq 0x0
   30158 scsi/27 VPD83T3:60060160116632000000000000000005 key 0x3 asc 0x11 ascq 0x0
   24589 scsi/27 VPD83T3:60060160116632000000000000000006 key 0x3 asc 0x11 ascq 0x0
   21579 scsi/27 VPD83T3:60060160116632000000000000000007 key 0x3 asc 0x11 ascq 0x0


Pokud se jedná o pole bez výrobce EMC, požádejte o vyřešení problému s diskovým polem příslušného dodavatele pole.
 

Additional Information

Jedná se o problém s vrstvou bloku v diskovém poli a lze jej vyřešit pouze provedením akce v samotném poli úložišť.

Nejedná se o problém VPLEX, ale o to, že systém VPLEX hlásí příznak z backendového pole.

Použití "storage-volume resurrect --force" zde neplatí.
Tento příkaz vynutí, aby se mrtvý svazek úložiště zobrazil ve VPLEX jako "aktivní" bez ohledu na jeho aktuální stav IO nebo problémy v základním diskovém poli.
Tento příkaz vynutí, aby se svazek úložiště vrátil do režimu online, dokud nedojde k selhání dalšího vstupně-výstupního panelu v základním poli úložiště.
Když si hostitel vyžádá stejný blok dat, u kterého došlo k problému 3/11/0 na základním diskovém poli, svazek úložiště bude opět označen za mrtvý.
Jedná se o očekávané chování, nikoli o známku problému


s VPLEX.Prezentace problematického svazku úložiště přímo z pole úložišť hostiteli (obejití VPLEX) může hostiteli umožnit použít některá data. Tato akce však přímo prezentuje hostiteli možnost poškození dat. Hostitel má i nadále problémy se čtením z konkrétních bloků s problémem s kontrolní podmínkou 3/11/0.

Affected Products

VPLEX Series

Products

CLARiiON, VNX1 Series, VNX2 Series, VPLEX for All Flash, VPLEX Series, VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000171097
Article Type: Solution
Last Modified: 15 Sept 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.