PowerFlexでSDSデバイス エラーをクリアできません:デバイスの状態がOSレベルでオフラインです

概要: SDSの「デバイス エラーのクリア」を使用しても機能せず、デバイスはエラーまたは障害状態のままになります。 SDSデバイスで多数のコンカレント デバイス エラーが発生した場合、デバイスを管理しているOSによってデバイスがオフラインになることがあります。

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

シナリオ

SDSデバイスに障害が発生するか、エラーが報告され、SDSの「デバイス エラーのクリア」を使用しようとすると、デバイスはエラーまたは障害状態のままになります。

現象

ScaleIOシステム イベントは、ディスク デバイスのエラーまたは障害を報告します。

 799   2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT      ERROR    Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT 

クエリーSDSは、ディスク デバイスのエラーまたは障害を報告します。

 ScaleIO-10-1-1-202:~ # scli --query_sds --sds_id 9780122600000003

Device information (total 8 devices):
         1: Name: ScaleIO-6a0a6209  Path: /dev/sdb  Original-path: /dev/sdb  ID: 851f01c100030000
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         2: Name: ScaleIO-6a0a620a  Path: /dev/sdc  Original-path: /dev/sdc  ID: 851f01c200030001
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         3: Name: ScaleIO-6a0a620b  Path: /dev/sdd  Original-path: /dev/sdd  ID: 851f01c300030002
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         4: Name: ScaleIO-6a0a620c  Path: /dev/sde  Original-path: /dev/sde  ID: 851f01c400030003
                Storage Pool: SSDPOOL, Capacity: 1489 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         5: Name: ScaleIO-6a0a620d  Path: /dev/sdf  Original-path: /dev/sdf  ID: 851f01c500030004
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Error
         6: Name: ScaleIO-6a0a620e  Path: /dev/sdg  Original-path: /dev/sdg  ID: 851f01c600030005
                Storage Pool: SSDPOOL, Capacity: 1489 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         7: Name: ScaleIO-6a0a620f  Path: /dev/sdh  Original-path: /dev/sdh  ID: 851f01c700030006
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         8: Name: ScaleIO-6a0a6210  Path: /dev/sdi  Original-path: /dev/sdi  ID: 851f01c800030007
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal

SVM/Linuxメッセージ ファイルがオフライン デバイスを報告する:

 Jan 22 17:28:35 ScaleIO-10-1-1-201 kernel: [45678.865605] end_request: I/O error, dev sdg, sector 1138313984
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.452800] sd 2:0:6:0: [sdg] task abort on host 2, ffff8800b83f6e80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.452877] sd 2:0:1:0: [sdb] task abort on host 2, ffff8801b7476d80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453086] sd 2:0:8:0: [sdh] task abort on host 2, ffff8800b83f6280
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453109] sd 2:0:8:0: [sdh] task abort on host 2, ffff8800a37a6c80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453133] sd 2:0:9:0: [sdi] task abort on host 2, ffff8800b83f6b80
Jan 22 17:28:47 ScaleIO-10-1-1-201 kernel: [45691.537180] sd 2:0:5:0: rejecting I/O to offline device

ディスク デバイスのESXi VMkernelログ レポートのエラー:

 2016-01-22T09:40:21.801Z cpu1:33420)ScsiDeviceIO: 7024: Could not detect setting of QErr for device naa.614187704f3b47001e34b585468abf85. Error Not supported.
2016-01-22T09:40:21.801Z cpu1:33420)ScsiDeviceIO: 7538: Could not detect setting of sitpua for device naa.614187704f3b47001e34b585468abf85. Error Not supported.
2016-01-22T09:40:21.801Z cpu5:33593)NMP: nmp_ThrottleLogForDevice:3178: Cmd 0x28 (0x439e1a830cc0, 0) to dev "naa.614187704f3b47001e34b585468abf85" on path "vmhba1:C2:T1:L0" Failed: H:0x0 D:0x2 P:0x0 Valid sense data: 0x6 0x29 0x0. Act:NONE
2016-01-22T09:40:21.801Z cpu5:33593)ScsiDeviceIO: 2607: Cmd(0x439e1a830cc0) 0x28, CmdSN 0xd62 from world 0 to dev "naa.614187704f3b47001e34b585468abf85" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x6 0x29 0x0.
2016-01-22T09:40:21.801Z cpu5:33593)ScsiCore: 1609: Power-on Reset occurred on naa.614187704f3b47001e34b585468abf85
2016-01-22T09:40:21.844Z cpu5:33593)NMP: nmp_ThrottleLogForDevice:3178: Cmd 0x1a (0x439e1a830cc0, 0) to dev "naa.614187704f3b47001e34b585468abf85" on path "vmhba1:C2:T1:L0" Failed: H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0. Act:NONE
2016-01-22T09:40:21.844Z cpu5:33593)ScsiDeviceIO: 2645: Cmd(0x439e1a830cc0) 0x1a, CmdSN 0xd66 from world 0 to dev "naa.614187704f3b47001e34b585468abf85" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0.
2016-01-22T09:40:21.844Z cpu1:33420)ScsiDevice: 3835: Successfully registered device "naa.614187704f3b47001e34b585468abf85" from plugin "NMP" of type 0
2016-01-22T09:40:21.844Z cpu1:33420)NMP: nmp_DeviceUpdateProtectionInfo:569: Set protection info for device 'naa.614187704f3b47001e34b585468abf85', Enabled: 0 ProtType: 0x0 Guard: 0x0 ProtMask: 0x0
2016-01-22T22:27:49.085Z cpu19:33115)WARNING: NMP: nmpDeviceTaskMgmt:2284: Attempt to issue lun reset on device naa.614187704f3b47001e34b585468abf85. This will clear any SCSI-2 reservations on the device.

問題

ディスク デバイスは障害が発生したままです
SDSデバイス エラーはクリアできません。

原因

ディスク デバイスに問題があり、何らかの理由でディスク デバイスが応答しない場合、OSはディスク デバイスをオフラインにします。
 
注:ディスク デバイスが誤動作している場合、デバイスはオンライン状態に戻らないため、ディスク デバイスの交換が必要になる場合があります。

解決方法

対策

SVM - Linux環境:

  1. ディスク デバイスの現在の状態を確認します
[root@ssltest ~]# cat /sys/block/sdx/device/state
offline 
  1. ディスク デバイスが「オフライン」とマークされている場合は、次のコマンドを使用して ディスク デバイスを「オンライン」にします
echo "running" > /sys/block/sdx/device/state
  1. SCLIまたはUIを使用して、 SDSデバイス エラーをクリア します。


Windows環境:

  1. 「論理ディスク マネージャー」またはディスク パーツを使用して、ディスク デバイスの現在の状態を確認します
C:\>diskpart
Microsoft DiskPart version 6.1.7601
Copyright (C) 1999-2008 Microsoft Corporation.
On computer: ISENABLOVSL1C
DISKPART> list disk
  Disk ###  Status         Size     Free     Dyn  Gpt
  --------  -------------  -------  -------  ---  ---
  Disk 0    Online          238 GB      0 B
DISKPART> 
  1. ディスク デバイスが「オフライン」とマークされている場合は、次のコマンドを使用して ディスク デバイスを「オンライン」 にするか、「論理ディスク マネージャー」を使用します。
DISKPART> online disk


任意のOS上のオンライン ディスク デバイスの代替オプション:


注:このオプションには「ダウンタイム」が必要であり、ScaleIOシステムで再構築/再バランシングがトリガーされます。
 
  1. 可能な場合は、SDSをメンテナンス モードにします
  2. SDSの再起動 サーバー
  3. メンテナンス モードの終了 (ステップ1で完了した場合)
  4. SDSデバイス エラーのクリア (UIまたはCLIを使用)
  5. ScaleIOでのデバイス状態の確認

対象製品

PowerFlex rack, ScaleIO
文書のプロパティ
文書番号: 000281632
文書の種類: Solution
最終更新: 06 3月 2025
バージョン:  3
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。