Il dispositivo PowerFlex ha corretto gli errori di lettura
Summary: I dispositivi SDS presentano errori indicanti "Device has fixed read errors".
Symptoms
Scenario
Ciò può verificarsi quando un dispositivo SDS presenta errori di lettura che sono stati corretti dall SDS.
Ciò può verificarsi quando lo scanner in background è disabilitato o abilitato.
Sintomi
Gli errori corretti su un dispositivo possono essere visualizzati nelle seguenti posizioni:
-
La GUI mostra un errore:
-
L'output "--query_sds --sds_id <SDS_ID>" mostra un contatore per ogni dispositivo con errori di lettura corretti:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
Il counters_dump.txt in MDM getInfoDump mostra le FIXED_READ_ERROR_COUNT su diversi oggetti:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Altri possibili sintomi: Il dispositivo potrebbe essere in stato di Errore. Potrebbero essere presenti errori sul dispositivo di blocco nei messaggi di sistema o nel syslog:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
Potrebbero essere presenti messaggi di I/O in esecuzione prolungata in SDS trc:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
Potrebbero essere presenti errori nei contatori I/O del dispositivo nel sdbg_out.txt dell SDS:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
La latenza del dispositivo può essere elevata in base a counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Impatto
Il contatore "Fixed Read Errors" non ha alcun impatto diretto sul sistema.
Tuttavia, può indicare una condizione sottostante che potrebbe causare disconnessioni dell SDS, attività di ricostruzione e così via.
Cause
Ciò può essere visualizzato quando un dispositivo SDS presenta errori di lettura che sono stati corretti o corretti utilizzando la copia con mirroring. La correzione può avvenire nei seguenti casi:
- Lo scanner in background non riesce a leggere da una copia dei dati e utilizza l'altra copia per sovrascriverli.
- Un SDS non riesce a soddisfare le richieste di lettura di un SDC a causa di un errore di lettura del disco e utilizza la copia secondaria per gestire l'I/O e sovrascrivere i dati locali.
L'avvertenza indica che il disco potrebbe rallentare, funzionare male o avere blocchi danneggiati. I meccanismi descritti in precedenza riscrivono i blocchi, in modo da correggere i blocchi danneggiati "soft".
Resolution
- Esaminare il disco. Se necessario, contattare il fornitore dell'hardware per sostituirlo.
Il contatore indica in genere una condizione sottostante e il disco si sta danneggiando. L'azione dell SDS spiegata in precedenza è un tentativo di correggere i soft bad block, ma potrebbe non avere successo in tutti gli scenari.
-
Svuota il contatore.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter