Пристрій PowerFlex виправив помилки зчитування
Summary: На пристроях SDS з'являються повідомлення про помилки «Пристрій виправив помилки зчитування».
Symptoms
Сценарій
Це може статися, коли пристрій SDS зчитував помилки, які були виправлені SDS.
Це може статися, коли фоновий сканер вимкнено або ввімкнено.
Симптоми
Виправлені помилки на пристрої можуть відображатися в таких місцях:
-
Графічний інтерфейс показує помилку:
-
Вивід "--query_sds --sds_id <SDS_ID>" показує лічильник для кожного пристрою з виправленими помилками зчитування:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
T counters_dump.txt у MDM getInfoDump показує FIXED_READ_ERROR_COUNT на різних об'єктах:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Інші можливі симптоми: Можливо, пристрій перебуває в стані помилки. На блоковому пристрої можуть бути помилки в системних повідомленнях або системному журналі:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
У SDS trc можуть бути тривалі повідомлення вводу-виводу в польоті:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
У sdbg_out.txt SDS можуть виникати помилки в лічильниках вводу/виводу пристрою:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Затримка пристрою може бути високою в залежності від counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Вплив
Лічильник «Виправлені помилки зчитування» не має прямого впливу на систему.
Однак це може вказувати на основне захворювання, яке може спричинити відключення SDS, діяльність з перебудови тощо.
Cause
Це можна побачити, коли пристрій SDS зчитав помилки, які були виправлені або виправлені за допомогою дзеркальної копії. Корекція може відбутися в наступних випадках:
- Фоновий сканер не може прочитати дані з однієї копії та використовує іншу копію для їх перезапису.
- SDS не може задовольнити запити SDC на читання через нездатність прочитати диск і використовує вторинну копію для обслуговування вводу/виводу та перезапису локальних даних.
Попередження вказує на те, що диск може сповільнюватися, псуватися або мати пошкоджені блоки. Описані вище механізми перезаписують блоки, що може виправити «м'які» бед-блоки.
Resolution
- Огляньте диск. За потреби зверніться до постачальника обладнання, щоб замінити його.
Лічильник зазвичай вказує на основне захворювання, і диск ламається. Дія SDS, описана вище, є спробою виправити м'які пошкоджені блоки, але може бути успішною не у всіх сценаріях.
-
Очистіть лічильник.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter