PowerFlexでSDSデバイス エラーをクリアできません:デバイスの状態がOSレベルでオフラインです

Summary: SDSの「デバイス エラーのクリア」を使用しても機能せず、デバイスはエラーまたは障害状態のままになります。 SDSデバイスで多数のコンカレント デバイス エラーが発生した場合、デバイスを管理しているOSによってデバイスがオフラインになることがあります。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

シナリオ

SDSデバイスに障害が発生するか、エラーが報告され、SDSの「デバイス エラーのクリア」を使用しようとすると、デバイスはエラーまたは障害状態のままになります。

現象

ScaleIOシステム イベントは、ディスク デバイスのエラーまたは障害を報告します。

 799   2016-01-22 17:28:39.818 SDS_DEV_ERROR_REPORT      ERROR    Device error reported on SDS: 10.3.1.21, Device: /dev/sdb. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS devErrState: REPORT 

クエリーSDSは、ディスク デバイスのエラーまたは障害を報告します。

 ScaleIO-10-1-1-202:~ # scli --query_sds --sds_id 9780122600000003

Device information (total 8 devices):
         1: Name: ScaleIO-6a0a6209  Path: /dev/sdb  Original-path: /dev/sdb  ID: 851f01c100030000
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         2: Name: ScaleIO-6a0a620a  Path: /dev/sdc  Original-path: /dev/sdc  ID: 851f01c200030001
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         3: Name: ScaleIO-6a0a620b  Path: /dev/sdd  Original-path: /dev/sdd  ID: 851f01c300030002
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         4: Name: ScaleIO-6a0a620c  Path: /dev/sde  Original-path: /dev/sde  ID: 851f01c400030003
                Storage Pool: SSDPOOL, Capacity: 1489 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         5: Name: ScaleIO-6a0a620d  Path: /dev/sdf  Original-path: /dev/sdf  ID: 851f01c500030004
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Error
         6: Name: ScaleIO-6a0a620e  Path: /dev/sdg  Original-path: /dev/sdg  ID: 851f01c600030005
                Storage Pool: SSDPOOL, Capacity: 1489 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         7: Name: ScaleIO-6a0a620f  Path: /dev/sdh  Original-path: /dev/sdh  ID: 851f01c700030006
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal
         8: Name: ScaleIO-6a0a6210  Path: /dev/sdi  Original-path: /dev/sdi  ID: 851f01c800030007
                Storage Pool: SASPOOL, Capacity: 1675 GB Error-fixes: 0 scanned 0 MB, Compare errors: 0 State: Normal

SVM/Linuxメッセージ ファイルがオフライン デバイスを報告する:

 Jan 22 17:28:35 ScaleIO-10-1-1-201 kernel: [45678.865605] end_request: I/O error, dev sdg, sector 1138313984
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.452800] sd 2:0:6:0: [sdg] task abort on host 2, ffff8800b83f6e80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.452877] sd 2:0:1:0: [sdb] task abort on host 2, ffff8801b7476d80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453086] sd 2:0:8:0: [sdh] task abort on host 2, ffff8800b83f6280
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453109] sd 2:0:8:0: [sdh] task abort on host 2, ffff8800a37a6c80
Jan 22 17:28:37 ScaleIO-10-1-1-201 kernel: [45681.453133] sd 2:0:9:0: [sdi] task abort on host 2, ffff8800b83f6b80
Jan 22 17:28:47 ScaleIO-10-1-1-201 kernel: [45691.537180] sd 2:0:5:0: rejecting I/O to offline device

ディスク デバイスのESXi VMkernelログ レポートのエラー:

 2016-01-22T09:40:21.801Z cpu1:33420)ScsiDeviceIO: 7024: Could not detect setting of QErr for device naa.614187704f3b47001e34b585468abf85. Error Not supported.
2016-01-22T09:40:21.801Z cpu1:33420)ScsiDeviceIO: 7538: Could not detect setting of sitpua for device naa.614187704f3b47001e34b585468abf85. Error Not supported.
2016-01-22T09:40:21.801Z cpu5:33593)NMP: nmp_ThrottleLogForDevice:3178: Cmd 0x28 (0x439e1a830cc0, 0) to dev "naa.614187704f3b47001e34b585468abf85" on path "vmhba1:C2:T1:L0" Failed: H:0x0 D:0x2 P:0x0 Valid sense data: 0x6 0x29 0x0. Act:NONE
2016-01-22T09:40:21.801Z cpu5:33593)ScsiDeviceIO: 2607: Cmd(0x439e1a830cc0) 0x28, CmdSN 0xd62 from world 0 to dev "naa.614187704f3b47001e34b585468abf85" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x6 0x29 0x0.
2016-01-22T09:40:21.801Z cpu5:33593)ScsiCore: 1609: Power-on Reset occurred on naa.614187704f3b47001e34b585468abf85
2016-01-22T09:40:21.844Z cpu5:33593)NMP: nmp_ThrottleLogForDevice:3178: Cmd 0x1a (0x439e1a830cc0, 0) to dev "naa.614187704f3b47001e34b585468abf85" on path "vmhba1:C2:T1:L0" Failed: H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0. Act:NONE
2016-01-22T09:40:21.844Z cpu5:33593)ScsiDeviceIO: 2645: Cmd(0x439e1a830cc0) 0x1a, CmdSN 0xd66 from world 0 to dev "naa.614187704f3b47001e34b585468abf85" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0.
2016-01-22T09:40:21.844Z cpu1:33420)ScsiDevice: 3835: Successfully registered device "naa.614187704f3b47001e34b585468abf85" from plugin "NMP" of type 0
2016-01-22T09:40:21.844Z cpu1:33420)NMP: nmp_DeviceUpdateProtectionInfo:569: Set protection info for device 'naa.614187704f3b47001e34b585468abf85', Enabled: 0 ProtType: 0x0 Guard: 0x0 ProtMask: 0x0
2016-01-22T22:27:49.085Z cpu19:33115)WARNING: NMP: nmpDeviceTaskMgmt:2284: Attempt to issue lun reset on device naa.614187704f3b47001e34b585468abf85. This will clear any SCSI-2 reservations on the device.

問題

ディスク デバイスは障害が発生したままです
SDSデバイス エラーはクリアできません。

Cause

ディスク デバイスに問題があり、何らかの理由でディスク デバイスが応答しない場合、OSはディスク デバイスをオフラインにします。
 
注:ディスク デバイスが誤動作している場合、デバイスはオンライン状態に戻らないため、ディスク デバイスの交換が必要になる場合があります。

Resolution

対策

SVM - Linux環境:

  1. ディスク デバイスの現在の状態を確認します
[root@ssltest ~]# cat /sys/block/sdx/device/state
offline 
  1. ディスク デバイスが「オフライン」とマークされている場合は、次のコマンドを使用して ディスク デバイスを「オンライン」にします
echo "running" > /sys/block/sdx/device/state
  1. SCLIまたはUIを使用して、 SDSデバイス エラーをクリア します。


Windows環境:

  1. 「論理ディスク マネージャー」またはディスク パーツを使用して、ディスク デバイスの現在の状態を確認します
C:\>diskpart
Microsoft DiskPart version 6.1.7601
Copyright (C) 1999-2008 Microsoft Corporation.
On computer: ISENABLOVSL1C
DISKPART> list disk
  Disk ###  Status         Size     Free     Dyn  Gpt
  --------  -------------  -------  -------  ---  ---
  Disk 0    Online          238 GB      0 B
DISKPART> 
  1. ディスク デバイスが「オフライン」とマークされている場合は、次のコマンドを使用して ディスク デバイスを「オンライン」 にするか、「論理ディスク マネージャー」を使用します。
DISKPART> online disk


任意のOS上のオンライン ディスク デバイスの代替オプション:


注:このオプションには「ダウンタイム」が必要であり、ScaleIOシステムで再構築/再バランシングがトリガーされます。
 
  1. 可能な場合は、SDSをメンテナンス モードにします
  2. SDSの再起動 サーバー
  3. メンテナンス モードの終了 (ステップ1で完了した場合)
  4. SDSデバイス エラーのクリア (UIまたはCLIを使用)
  5. ScaleIOでのデバイス状態の確認

Affected Products

PowerFlex rack, ScaleIO
Article Properties
Article Number: 000281632
Article Type: Solution
Last Modified: 06 Mar 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.