PowerFlex-enheten har åtgärdade läsfel
Summary: SDS-enheter har felmeddelanden som anger "Enheten har åtgärdat läsfel".
Symptoms
Scenario
Detta kan inträffa när en SDS-enhet har läsfel som har korrigerats av SDS.
Detta kan inträffa när bakgrundsskannern är inaktiverad eller aktiverad.
Symptom
De fasta felen på en enhet kan visas på följande platser:
-
Det grafiska användargränssnittet visar ett fel:
-
Utdata "--query_sds --sds_id <SDS_ID>" visar en räknare för varje enhet med korrigerade läsfel:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
Den counters_dump.txt i MDM getInfoDump visar FIXED_READ_ERROR_COUNT på olika objekt:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Andra möjliga symtom: Enheten kan vara i ett feltillstånd. Det kan finnas fel på blockenheten i systemmeddelandena eller syslog:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
Det kan förekomma långa IO-meddelanden ombord i SDS trc:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
Det kan finnas fel i enhetens I/O-räknare i SDS-sdbg_out.txt:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Enhetens svarstid kan vara hög enligt counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Påverkan
Räknaren "Fixed Read Errors" har ingen direkt inverkan på systemet.
Det kan dock tyda på ett underliggande tillstånd som kan orsaka SDS-frånkopplingar, återuppbyggnadsaktiviteter osv.
Cause
Det här kan uppstå när en SDS-enhet har läsfel som har korrigerats eller åtgärdats med hjälp av den speglade kopian. Korrigeringen kan ske i följande fall:
- Bakgrundsskannern kan inte läsa från en kopia av data och använder den andra kopian för att skriva över den.
- En SDS kan inte hantera en SDC:s läsbegäranden på grund av att det inte går att läsa disken, och använder den sekundära kopian för att hantera I/O och skriva över lokala data.
Varningen indikerar att disken kan bli långsammare, gå dåligt eller ha felaktiga block. Mekanismerna som beskrivs ovan skriver om blocken, vilket kan fixa "mjuka" dåliga block.
Resolution
- Undersök disken. Om det behövs kontaktar du maskinvaruleverantören för att byta ut den.
Räknaren indikerar vanligtvis ett underliggande tillstånd och disken går sönder. SDS:s åtgärd som förklaras ovan är ett försök att fixa mjuka dåliga block men kanske inte lyckas i alla scenarier.
-
Rensa disken.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter