На устройстве PowerFlex исправлены ошибки чтения
Summary: Устройства SDS имеют ошибки, указывающие на «Device has fixed read» («На устройстве исправлены ошибки чтения»).
Symptoms
Сценарий
Это может произойти, если устройство SDS считывает ошибки, которые были исправлены программой SDS.
Это может происходить, когда фоновый сканер выключен или включен.
Симптомы
Исправленные ошибки на устройстве могут быть показаны в следующих местах:
-
В графическом интерфейсе отображается ошибка:
-
В выводе «--query_sds --sds_id <SDS_ID>» показан счетчик для каждого устройства с исправленными ошибками чтения:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
T counters_dump.txt в MDM getInfoDump показывает FIXED_READ_ERROR_COUNT на разных объектах:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Другие возможные симптомы: Устройство может находиться в состоянии «Ошибка». В системных сообщениях или системном журнале могут быть ошибки блочного устройства:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
В SDS trc могут быть длинные передаваемые сообщения ввода-вывода:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
В sdbg_out.txt SDS могут быть ошибки счетчиков ввода-вывода устройства:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Задержка устройства может быть высокой в зависимости от counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Воздействие
Счетчик «Fixed Read Errors» не оказывает прямого влияния на работу системы.
Однако это может указывать на основное состояние, которое может привести к отключению SDS, восстановлению и т. д.
Cause
Это можно увидеть, если устройство SDS считывает ошибки, которые были исправлены или исправлены с помощью зеркальной копии. Коррекция может произойти в следующих случаях:
- Фоновый сканер не может прочитать одну копию данных и использует другую копию для их перезаписи.
- SDS не может обслуживать запросы на чтение SDC из-за сбоя чтения диска и использует вторичную копию для обслуживания операций ввода-вывода и перезаписи локальных данных.
Предупреждение указывает на то, что диск замедляет работу, работает неправильно или имеет поврежденные блоки. Механизмы, описанные выше, перезаписывают блоки, что может исправить «мягкие» плохие блоки.
Resolution
- Осмотрите диск. При необходимости обратитесь к поставщику оборудования для замены.
Счетчик обычно указывает на основное заболевание, и диск ломается. Действие SDS, описанное выше, является попыткой исправить мягкие поврежденные блоки, но может быть успешным не во всех сценариях.
-
Очистите счетчик.
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter