PowerFlex 디바이스에 수정된 읽기 오류가 있습니다.
Summary: SDS 디바이스에 "디바이스에 읽기 오류가 수정되었습니다"라는 오류가 있습니다.
Symptoms
시나리오
이 문제는 SDS 디바이스에 SDS에서 수정한 읽기 오류가 있을 때 발생할 수 있습니다.
이 문제는 배경 스캐너가 비활성화되거나 활성화된 경우 발생할 수 있습니다.
증상
디바이스에서 수정된 오류는 다음 위치에 표시될 수 있습니다.
-
GUI에 오류가 표시됩니다.
-
"--query_sds --sds_id <SDS_ID>" 출력에는 수정된 읽기 오류가 있는 각 디바이스에 대한 카운터가 표시됩니다.
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
MDM getInfoDump의 counters_dump.txt는 서로 다른 오브젝트의 FIXED_READ_ERROR_COUNT 보여줍니다.
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
기타 가능한 증상: 디바이스가 오류 상태일 수 있습니다. 시스템 메시지 또는 syslog의 블록 디바이스에 오류가 있을 수 있습니다.
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
SDS trc에 긴 인플라이트 IO 메시지가 있을 수 있습니다.
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
SDS sdbg_out.txt의 디바이스 I/O 카운터에 오류가 있을 수 있습니다.
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
장치의 대기 시간은 counters_dump.txt에 따라 길어질 수 있습니다.
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
영향
"Fixed Read Errors" 카운터는 시스템에 직접적인 영향을 주지 않습니다.
그러나 SDS 연결 해제, 재구축 작업 등을 유발할 수 있는 기본 상태를 나타낼 수 있습니다.
Cause
이는 SDS 디바이스에 미러링된 복제본을 사용하여 수정 또는 수정된 읽기 오류가 있는 경우 확인할 수 있습니다. 수정은 다음과 같은 경우에 발생할 수 있습니다.
- 백그라운드 스캐너가 데이터의 한 복사본에서 데이터를 읽지 못하고 다른 복사본을 사용하여 덮어씁니다.
- 디스크 읽기 장애로 인해 SDS가 SDC의 읽기 요청을 처리하지 못하고 보조 복제본을 사용하여 I/O를 처리하고 로컬 데이터를 덮어씁니다.
이 경고는 디스크가 느려지거나, 불량하거나, 불량 블록이 있을 수 있음을 나타냅니다. 위에서 설명한 메커니즘은 블록을 다시 작성하여 "소프트" 불량 블록을 수정할 수 있습니다.
Resolution
- 디스크를 검사합니다. 필요한 경우 하드웨어 공급업체에 문의하여 교체합니다.
카운터는 일반적으로 기본 상태를 나타내며 디스크가 손상되고 있습니다. 위에서 설명한 SDS의 조치는 소프트 불량 블록을 수정하기 위한 시도이지만 모든 시나리오에서 성공하지 못할 수 있습니다.
-
카운터를 비웁니다.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter