Zařízení PowerFlex má opraveny chyby čtení
Summary: V zařízeních SDS se zobrazují chyby "Zařízení má opravené chyby čtení".
Symptoms
Scénář
K tomu může dojít, když zařízení SDS obsahuje chyby čtení, které byly opraveny SDS.
K tomu může dojít, když je zakázán nebo povolen snímač na pozadí.
Příznaky
Opravené chyby na zařízení se mohou zobrazit na následujících místech:
-
V grafickém uživatelském rozhraní se zobrazí chyba:
-
Výstup "--query_sds --sds_id <SDS_ID>" zobrazuje čítač pro každé zařízení s opravenými chybami čtení:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
counters_dump.txt v MDM getInfoDump zobrazuje FIXED_READ_ERROR_COUNT různých objektů:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Další možné příznaky: Zařízení může být v chybovém stavu. Na blokovém zařízení se mohou vyskytnout chyby v systémových zprávách nebo syslogu:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
V SDS trc se mohou vyskytovat dlouhé zprávy IO za letu:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
V sdbg_out.txt SDS se mohou vyskytnout chyby v čítačích I/O zařízení:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Latence zařízení může být vysoká podle counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Důsledky
Počítadlo "Opravené chyby čtení" nemá žádný přímý vliv na systém.
Může však označovat základní podmínku, která může způsobit odpojení SDS, aktivity opětovného vytvoření atd.
Cause
To se může projevit, když zařízení SDS obsahuje chyby čtení, které byly opraveny pomocí zrcadlené kopie. K opravě může dojít v následujících případech:
- Skener na pozadí nedokáže číst z jedné kopie dat a použije druhou kopii k jejich přepsání.
- Disk SDS nedokáže obsluhovat požadavky SDC na čtení z důvodu selhání čtení disku a používá sekundární kopii k obsluze operací I/O a přepsání místních dat.
Upozornění signalizuje, že disk může zpomalovat, pokazit se nebo má vadné bloky. Výše popsané mechanismy přepisují bloky, což může opravit "měkké" špatné bloky.
Resolution
- Zkontrolujte disk. V případě potřeby kontaktujte dodavatele hardwaru a požádejte jej o výměnu.
Čítač obvykle indikuje základní podmínku a rozpad disku. Výše vysvětlená akce SDS je pokusem o opravu měkkých špatných bloků, ale nemusí být úspěšná ve všech scénářích.
-
Vymažte počítadlo.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter