「VPLEX:ストレージアレイからのSCSIチェック状態B/44/00が原因で、ストレージボリュームが重大な障害状態になります
Summary: VPLEXは、基盤となるストレージアレイからのSCSIセンス コードB/44/00により、ディスクをdeadとマークします。
Symptoms
VPLEXストレージ ボリュームは重大な障害状態にあり、基盤となるボリュームはアレイ側で正常です。
cliコマンドの出力例: ll /clusters/cluster-1/storage-elements/storage-volumes/<storage-volume name>
VPlexcli:/> ll /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000 /clusters/cluster-1/storage-elements/storage-volumes/Symm1234_0000: Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 65798400 block-size 4K capacity 251G description - free-chunks [] health-indications [hardware dead] health-state critical-failure <<-- io-status dead itls 0x50001442607de710/0x5000097378028844/80, 0x50001442607de710/0x50000973780288c4/80, 0x50001442607de711/0x5000097378028844/80, 0x50001442607de711/0x50000973780288c4/80, 0x50001442707de710/0x5000097378028844/80, 0x50001442707de710/0x50000973780288c4/80, 0x50001442707de711/0x5000097378028844/80, 0x50001442707de711/0x50000973780288c4/80, 0x50001442a0100410/0x5000097378028844/80, 0x50001442a0100410/0x50000973780288c4/80, ... (16 total) largest-free-chunk 0B locality - operational-status error provision-type legacy storage-array-name EMC-SYMMETRIX-XXXXXXXXX storage-volumetype normal system-id VPD83T3:60000097000000000000000000000000 thin-capable false thin-rebuild true total-free-space 0B underlying-storage-block-size 512 use unusable used-by [extent_Symm1234_0000_1] vendor-specific-name EMC
重大な障害状態のストレージ ボリューム
VPlexcli:/> storage-volume summary SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State ---------------------------------------- --------- ------------------ ---------------- Symm1234_0000 dead error critical-failure <<--
停止した論理ユニットをハイライトしたオートコールからの抜粋例:
<EventData><![CDATA[disk VPD83T3:60000970000000000000000000000000: disk died, no mirror exists
このストレージボリュームが分散デバイスの一部でない場合、ホストはこの仮想ボリュームへのアクセスを失い、データ欠損状態を引き起こします。
VPlexファームウェア ログは、SCSIセンス コード キー 0xb asc 0x44 ascq 0x0 (B/44/00) を使用したscsi/27イベントのストリーミングを示します。これは、「 INTERNAL TARGET FAILURE」に変換されます。
firmware.logからのscsi/27インスタンスの例
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298782:<6>2016/11/11 06:50:57.94: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298783:<6>2016/11/11 06:50:58.00: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298784:<6>2016/11/11 06:50:58.16: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298785:<6>2016/11/11 06:50:58.30: scsi/27 tgt VPD83T3:60000097000000000000000000000000 cmd 0x2a status 0x2 valid 0 resp 0x70 seg 0x0 bits 0x0 key 0xb info 0x0 alen 10 csi 0x0 asc 0x44 ascq 0x0 fru 0x0 sks 0x0
21回の再試行が実行され、継続的な書き込みエラーによりストレージボリュームが使用不能とマークされる。
128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298797:<4>2016/11/11 06:51:01.42: amf/45 disk VPD83T3:60000097000000000000000000000000: write failure: marking this in-use disk dead 128.221.253.37/cpu0/log:5988:W/"0060166fcbfe192045-1":3298798:<2>2016/11/11 06:51:01.42: amf/97 disk VPD83T3:60000097000000000000000000000000: disk died, no mirror exists
Cause
ストレージアレイが書き込みI/O要求(0x2a)に対してB/44/00を返す。アレイはI/O要求を処理できず、チェック条件B/44/00(内部ターゲット障害)で応答する
基盤となるストレージ ボリュームがVMAXボリュームの場合、次の理由によりI/O障害が発生する可能性があります。
VMAXがIOを中止した理由は、VPlexには提供されません。内部ターゲットの障害が発生する理由は多数あり、非常に広範囲の原因が原因である可能性があります。
Resolution
SCSIチェック条件B/44/00をVPLEXに送信しているストレージアレイは、それぞれのアレイ ベンダーによって調査される必要があります。この問題は、ストレージアレイの「内部ターゲット障害」の問題により、アレイが書き込みI/O要求を処理できないことによって引き起こされます。
基盤となるアレイがVMAXアレイの場合、アレイはいくつかの理由でSCSIチェック条件「B/44/00」を送信することがあります。
VPLEX管理サーバーで次のcliコマンドを実行すると、B/44/00チェック条件の影響を受ける論理ユニットのリストを取得できます。
grep "scsi/27" firmware.log* | grep 'key 0xb' |awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
例:
service@ManagementServer:~> grep "scsi/27" firmware.log* | grep 'key 0xb' | awk '{print $3, $5, $18, $19, $26,$27,$28,$29}'| sort | uniq -c | sort -nr
103474 scsi/27 VPD83T3:60000097000000000000000000000000 key 0xb asc 0x44 ascq 0x0
45254 scsi/27 VPD83T3:60000097000000000000000000000001 key 0xb asc 0x44 ascq 0x0
32908 scsi/27 VPD83T3:60000097000000000000000000000002 key 0xb asc 0x44 ascq 0x0
25581 scsi/27 VPD83T3:60000097000000000000000000000003 key 0xb asc 0x44 ascq 0x0
21043 scsi/27 VPD83T3:60000097000000000000000000000004 key 0xb asc 0x44 ascq 0x0
10809 scsi/27 VPD83T3:60000097000000000000000000000005 key 0xb asc 0x44 ascq 0x0
10651 scsi/27 VPD83T3:60000097000000000000000000000006 key 0xb asc 0x44 ascq 0x0
EMC以外のアレイの場合は、ストレージアレイに存在する問題を解決するために、それぞれのアレイ ベンダーと連携します。
Additional Information
これはVPlexの問題ではなく、バックエンド アレイまたはファブリックの問題である可能性があります。
ストレージアレイ チーム、接続チーム、またはその両方が関与する必要があります。