PowerFlex 设备已修复读取错误

摘要: SDS 设备出现错误,指出“设备已修复读取错误”。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

情况说明

当 SDS 设备具有由 SDS 纠正的读取错误时,可能会发生这种情况。

当后台扫描程序处于禁用或启用状态时,可能会发生这种情况。

症状

设备上已修复的错误可在以下位置显示:

  • GUI 显示错误:

  • “--query_sds --sds_id <SDS_ID>”输出显示具有更正读取错误的每个设备的计数器:

15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
           Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal

MDM getInfoDump 中的counters_dump.txt显示不同对象上的FIXED_READ_ERROR_COUNT:

ID: df7700a600120012 DEVICE_TYPE                READ_ERR                                    FIXED_READ_ERROR_COUNT   1
ID: 1d1e4e5500000012 SDS_TYPE                   READ_ERR                                    FIXED_READ_ERROR_COUNT   1
ID: 1c34e1f700000007 STORAGE_POOL_TYPE          READ_ERR                                    FIXED_READ_ERROR_COUNT   1
ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE     READ_ERR                                    FIXED_READ_ERROR_COUNT   1
ID: 49b6b8057d1fc84b SYSTEM_TYPE                READ_ERR                                    FIXED_READ_ERROR_COUNT   1
提醒:MDM 事件日志中没有事件指示出现此“已修复读取错误”情况。

其他可能的症状:设备可能处于错误状态。系统消息或系统日志中可能存在有关块设备上的错误:

blk_update_request: critical medium error, dev sdr, sector 94390272
  sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
  sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] 
  sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error

SDS trc 中可能存在较长的飞行 IO 消息:

contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis

SDS sdbg_out.txt中的设备 I/O 计数器中可能存在错误:

13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
  Io Counters:
   GENERAL
     Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
     Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
   BM
     Writes: 0 Lbs: 0 MBs: 0 Errors: 0
     Reads: 0 Lbs: 0 MBs: 0 Errors: 0
   COMB_MAP
     Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
     Reads: 0 Lbs: 0 MBs: 0 Errors: 0
   TOOTH_MAP
     Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
     Reads: 0 Lbs: 0 MBs: 0 Errors: 0
   IO
     Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
     Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22

根据以下counters_dump.txt,设备的延迟可能很高:

ID: 2d63f7c60003000c DEVICE_TYPE                DEV_LATENCY                          AVG_WRITE_LATENCY_IN_MICROSEC   0
ID: 2d63f7c70003000d DEVICE_TYPE                DEV_LATENCY                          AVG_WRITE_LATENCY_IN_MICROSEC   0
ID: 2d63f7c80003000e DEVICE_TYPE                DEV_LATENCY                          AVG_WRITE_LATENCY_IN_MICROSEC   11424
ID: 2d63f7c90003000f DEVICE_TYPE                DEV_LATENCY                          AVG_WRITE_LATENCY_IN_MICROSEC   0
ID: 2d63f7ca00030010 DEVICE_TYPE                DEV_LATENCY                          AVG_WRITE_LATENCY_IN_MICROSEC   0

 

影响

“Fixed Read Errors”计数器不会对系统产生任何直接影响。

但是,它可能表示可能导致 SDS 断开连接、重建活动等的潜在条件。

原因

当 SDS 设备使用镜像拷贝更正或修复的读取错误时,就会出现这种情况。在以下情况下可能会发生更正:      

  • 后台扫描程序无法从数据的一个拷贝读取数据,并使用另一个拷贝来覆盖数据。
  • 由于无法读取磁盘,SDS 无法处理 SDC 的读取请求,并使用辅助副本来处理 I/O 并覆盖本地数据。

警告表示磁盘可能正在变慢、变坏或具有坏块。上述机制重写块,可以修复“软”坏块。

解决方案

  • 检查磁盘。如有必要,请联系硬件供应商进行更换。
    计数器通常表示存在潜在情况,并且磁盘正在损坏。上述 SDS作是尝试修复软坏块,但可能无法在所有情况下成功。
     
  • 清空计数器。

scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter
文章属性
文章编号: 000174344
文章类型: Solution
上次修改时间: 19 9月 2025
版本:  6
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。