Urządzenie PowerFlex ma naprawione błędy odczytu
Summary: Na urządzeniach SDS występują błędy "Urządzenie ma naprawione błędy odczytu".
Symptoms
Scenariusz
Taka sytuacja może wystąpić, gdy urządzenie SDS ma błędy odczytu, które zostały naprawione przez SDS.
Może się tak zdarzyć, gdy skaner w tle jest wyłączony lub włączony.
Objawy
Naprawione błędy urządzenia mogą być wyświetlane w następujących miejscach:
-
Graficzny interfejs użytkownika wyświetla błąd:
-
Dane wyjściowe "--query_sds --sds_id <SDS_ID>" pokazują licznik dla każdego urządzenia z poprawionymi błędami odczytu:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
counters_dump.txt w getInfoDump MDM pokazuje FIXED_READ_ERROR_COUNT na różnych obiektach:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Inne możliwe objawy: Urządzenie może być w stanie błędu. W komunikatach systemowych lub dzienniku systemowym mogą występować błędy urządzenia blokowego:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
W kontrolerze SDS trc mogą występować długie komunikaty we/wy podczas lotu:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
Mogą występować błędy w licznikach we/wy urządzenia w sdbg_out.txt SDS:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Opóźnienie urządzenia może być wysokie w zależności od counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Wpływ
Licznik "Fixed Read Errors" nie ma bezpośredniego wpływu na system.
Może jednak wskazywać na podstawowy stan, który może powodować rozłączenia SDS, działania odbudowy itp.
Cause
Można to zaobserwować, gdy urządzenie SDS odczytało błędy, które zostały poprawione lub naprawione za pomocą kopii lustrzanej. Korekta może nastąpić w następujących przypadkach:
- Skaner w tle nie odczytuje danych z jednej kopii i zastępuje je drugą kopią.
- Serwer SDS nie obsługuje żądań odczytu SDC z powodu niepowodzenia odczytu dysku i używa kopii pomocniczej do obsługi operacji we/wy i nadpisywania danych lokalnych.
Ostrzeżenie wskazuje, że dysk może zwalniać, psuć się lub mieć uszkodzone bloki. Opisane powyżej mechanizmy przepisują bloki, co może naprawić "miękkie" uszkodzone bloki.
Resolution
- Sprawdź dysk. W razie potrzeby skontaktuj się z dostawcą sprzętu w celu wymiany sprzętu.
Licznik zwykle wskazuje podstawowy stan, a dysk jest uszkodzony. Działanie SDS wyjaśnione powyżej jest próbą naprawienia miękkich uszkodzonych bloków, ale może się nie udać we wszystkich scenariuszach.
-
Wyczyść licznik.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter