PowerFlexデバイスの読み取りエラーが修正されました
Summary: SDSデバイスに「Device has fixed read errors」というエラーがあります。
Symptoms
シナリオ
これは、SDSデバイスにある読み取りエラーがSDSによって修正された場合に発生する可能性があります。
これは、バックグラウンド スキャナーが無効または有効の場合に発生する可能性があります。
現象
デバイスで修正されたエラーは、次の場所に表示されます。
-
GUIに次のエラーが表示されます。
-
「--query_sds --sds_id <SDS_ID>」の出力には、修正された読み取りエラーがある各デバイスのカウンターが表示されます。
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
MDM getInfoDumpのcounters_dump.txtには、さまざまなオブジェクトのFIXED_READ_ERROR_COUNTが表示されます。
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
その他の考えられる症状: デバイスがエラー状態になっている可能性があります。システム メッセージまたはSyslogにブロック デバイスのエラーがある可能性があります。
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
SDS trc に長いインフライト IO メッセージが表示される場合があります。
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
SDSのsdbg_out.txtで、デバイスのI/Oカウンターにエラーがある可能性があります。
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
デバイスのレイテンシーは、次のcounters_dump.txtによって長くなる場合があります。
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
問題
「Fixed Read Errors」カウンターは、システムに直接影響しません。
ただし、SDSの切断、再構築アクティビティーなどを引き起こす可能性のある根本的な状態を示している可能性があります。
Cause
これは、ミラーリングされたコピーを使用して修正または修正されたSDSデバイスの読み取りエラーがある場合に表示されます。修正は、次の場合に発生する可能性があります。
- バックグラウンド スキャナーは、データの一方のコピーからの読み取りに失敗し、もう一方のコピーを使用してデータを上書きします。
- ディスクの読み取りに失敗したため、SDSはSDCの読み取り要求の処理に失敗し、セカンダリー コピーを使用してI/Oを処理し、ローカル データを上書きします。
この警告は、ディスクの速度が低下している、ディスクが劣化している、不良ブロックが発生している可能性があることを示します。上記のメカニズムはブロックを再書き込みし、「ソフト」不良ブロックを修正できます。
Resolution
- ディスクを調べます。必要に応じて、ハードウェア ベンダーに交換を依頼します。
通常、カウンターは根本的な状態を示し、ディスクが破損しています。上記で説明したSDSのアクションは、ソフト不良ブロックを修正する試みですが、すべてのシナリオで成功するとは限りません。
-
カウンターをクリアします。
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter