PowerFlex. Устройство имеет исправленные ошибки чтения — сброс счетчика ошибок устройства
Summary: Устройства SDS имеют ошибки «Device has fixed read errors»
Symptoms
- Это может произойти, если устройство SDS считывает ошибки, которые были исправлены программой SDS.
- Это может происходить, когда фоновый сканер выключен или включен.
Исправленные ошибки на устройстве могут быть показаны в следующих местах:
-
В графическом интерфейсе отображается ошибка:

-
В выводе «--query_sds --sds_id <SDS_ID>» показан счетчик для каждого устройства с исправленными ошибками чтения:
15: Name: /dev/sdr Path: /dev/sdr Original-path: /dev/sdr ID: 2d63f7c80003000e
Storage Pool: SAS_pool1, Capacity: 1116 GB Error-fixes: 6 scanned 0 MB, Compare errors: 0 State: Normal
T counters_dump.txt в MDM getInfoDump показывает FIXED_READ_ERROR_COUNT на разных объектах:
ID: df7700a600120012 DEVICE_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1d1e4e5500000012 SDS_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 1c34e1f700000007 STORAGE_POOL_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: b9b286df00000001 PROTECTION_DOMAIN_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1 ID: 49b6b8057d1fc84b SYSTEM_TYPE READ_ERR FIXED_READ_ERROR_COUNT 1
Другие возможные симптомы: Устройство может находиться в состоянии «Ошибка». В системных сообщениях или системном журнале могут быть ошибки блочного устройства:
blk_update_request: critical medium error, dev sdr, sector 94390272 sd 0:2:15:0: [sdr] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE sd 0:2:15:0: [sdr] tag#1 Sense Key : Medium Error [current] sd 0:2:15:0: [sdr] tag#1 Add. Sense: Unrecovered read error
В SDS trc могут быть длинные передаваемые сообщения ввода-вывода:
contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 12250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 13250 millis contDevMngr_HandleLongInflightIoViolation:02998: IO on devId: 2d63f7c80003000e (/dev/sdr) took too long, Low threshold exceeded - waited for reaper 14250 millis
В sdbg_out.txt SDS могут быть ошибки счетчиков ввода-вывода устройства:
13: Dev path:/dev/sdr Size(lbs):0 Time grn:520577464
Io Counters:
GENERAL
Writes: 4852 Lbs: 2160443 MBs: 1054 Errors: 0
Reads: 49283 Lbs: 111376 MBs: 54 Errors: 12744
BM
Writes: 0 Lbs: 0 MBs: 0 Errors: 0
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
COMB_MAP
Writes: 5 Lbs: 1390 MBs: 0 Errors: 2
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
TOOTH_MAP
Writes: 426 Lbs: 688528 MBs: 336 Errors: 424
Reads: 0 Lbs: 0 MBs: 0 Errors: 0
IO
Writes: 4319 Lbs: 603064 MBs: 294 Errors: 16
Reads: 2076 Lbs: 16608 MBs: 8 Errors: 22
Задержка устройства может быть высокой в зависимости от counters_dump.txt:
ID: 2d63f7c60003000c DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c70003000d DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7c80003000e DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 11424 ID: 2d63f7c90003000f DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0 ID: 2d63f7ca00030010 DEVICE_TYPE DEV_LATENCY AVG_WRITE_LATENCY_IN_MICROSEC 0
Воздействие
Счетчик «Fixed Read Errors» не оказывает прямого влияния на работу системы.
Однако это может указывать на основное состояние, которое может привести к отключению SDS, восстановлению и т. д.
Cause
Это можно увидеть, если устройство SDS считывает ошибки, которые были исправлены или исправлены с помощью зеркальной копии. Коррекция может произойти в следующих случаях:
- Фоновый сканер не может прочитать одну копию данных и использует другую копию для их перезаписи.
- SDS не может обслуживать запросы на чтение SDC из-за сбоя чтения диска и использует вторичную копию для обслуживания операций ввода-вывода и перезаписи локальных данных.
Предупреждение указывает на то, что диск замедляет работу, работает неправильно или имеет поврежденные блоки. Механизмы, описанные выше, перезаписывают блоки, что может исправить «мягкие» плохие блоки.
Resolution
- Осмотрите диск. При необходимости обратитесь к поставщику оборудования для замены.
Счетчик обычно указывает на основное заболевание, и диск ломается. Действие SDS, описанное выше, является попыткой исправить мягкие поврежденные блоки, но может быть успешным не во всех сценариях.
-
Очистите счетчик ошибок, выполнив следующую команду из основного MDM с учетной записью администратора
scli --reset_scanner_error_counters --protection_domain_id <pd id> --storage_pool_id <sp id> --reset_corrected_read_error_counter
Можно запустить scli --query_all Вывод списка идентификаторов защищенного домена и пула хранения данных