PowerFlex-enheden har rettet læsefejl
Summary: SDS-enheder har fejl, der angiver "Enheden har rettet læsefejl."
Symptoms
Scenarie
Dette kan opstå, når en SDS-enhed har læsefejl, der er blevet rettet af SDS.
Dette kan forekomme, når baggrundsscanneren er deaktiveret eller aktiveret.
Symptomer
De rettede fejl på en enhed kan vises følgende steder:
-
Den grafiske brugergrænseflade viser en fejl:
-
Outputtet "--query_sds --sds_id <SDS_ID>" viser en tæller for hver enhed med korrigerede læsefejl:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
Den counters_dump.txt i MDM getInfoDump viser FIXED_READ_ERROR_COUNT på forskellige objekter:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Andre mulige symptomer: Enheden kan være i fejltilstand. Der kan være fejl på blokenheden i systemmeddelelserne eller syslog:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
Der kan være lange IO-meddelelser om bord i SDS trc:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
Der kan være fejl i enhedens I / O-tællere i SDS 'sdbg_out.txt:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Enhedens latenstid kan være høj i henhold til counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Påvirkning
Tælleren "Rettede læsefejl" har ingen direkte indvirkning på systemet.
Det kan dog indikere en underliggende tilstand, der kan forårsage SDS-afbrydelser, genopbygningsaktiviteter osv.
Cause
Dette kan ses, når en SDS-enhed har læsefejl, der er blevet rettet eller rettet ved hjælp af den spejlede kopi. Korrektionen kan ske i følgende tilfælde:
- Baggrundsscanneren kan ikke læse fra den ene kopi af dataene og bruger den anden kopi til at overskrive dem.
- Et SDS kan ikke opfylde SDC's læseanmodninger på grund af manglende læsning af disken og bruger den sekundære kopi til at betjene I/O en og overskrive de lokale data.
Advarslen angiver, at disken muligvis bliver langsommere, bliver dårlig eller har dårlige blokeringer. Mekanismerne beskrevet ovenfor omskriver blokkene, som kan rette "bløde" dårlige blokke.
Resolution
- Undersøg disken. Kontakt om nødvendigt hardwareleverandøren for at få den udskiftet.
Tælleren angiver normalt en underliggende tilstand, og disken går i stykker. SDS 'handling forklaret ovenfor er et forsøg på at rette bløde dårlige blokke, men lykkes muligvis ikke i alle scenarier.
-
Ryd disken.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter