Проблема производительности PowerFlex 3.x с потенциальными ошибками ввода-вывода во время обратного восстановления
Сводка: Во время событий обратного восстановления могут появляться сообщения об ошибках ввода-вывода. В серьезных случаях тома могут стать доступными только для чтения, что приведет к недоступности данных. Во время обратного перестроения роли гребня (основная/дополнительная) меняются местами. Обратное восстановление может выполняться, когда SDS 1) выводится из режима обслуживания или 2) когда SDS отключается и быстро восстанавливается. ...
Симптомы
Сценарий
MDM отправляет много команд управления в SDS во время восстановления, но SDS не может обработать их быстро.
Симптомы
В следующих записях MDM пытается выполнить переключение роли гребня, но SDS потребовалось 30 с, чтобы завершить операцию. В данном примере этой задержки в 30 секунд было достаточно, чтобы том стал доступен только для чтения.
15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE (...) 15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357 15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353 15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227 NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE)
Чтобы проверить это условие (2-й и 3-й столбцы должны быть одинаковыми и иметь значение 100), выполните следующее.
scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
Это также будет указано в выходных данных query_all следующим образом:
grep CONTROL_UMT query_all.txt
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
Воздействие
Могут появляться сообщения об ошибках ввода-вывода, и в серьезных случаях тома могут стать доступными только для чтения.
Причина
SDS не может обрабатывать большое количество команд управления, так как для SDS_NUMBER_SDS_CONTROL_UMT установлено только значение 10. Это может произойти, если для профиля производительности SDS установлено значение «Компактно» или «Высокая производительность», но система была модернизирована с PowerFlex 2.x до 3.x.
Профиль high_performance устанавливает SDS_NUMBER_SDS_CONTROL_UMT равным 100; Однако это значение может быть ошибочно изменено на 10 при модернизации с любой версии 2.x до версии 3.x ниже 3.0.1.5/3.5.1.3.
10 — ожидаемое значение для SDS_NUMBER_SDS_CONTROL_UMT, когда настроен профиль производительности компактных дисков (в версии 3.x по умолчанию используется профиль high_performance).
Разрешение
Если используется high_performance профиль SDS, выполните следующую команду для устранения этой проблемы:
scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100
Если используется компактный профиль SDS, измените его на high_performance.
Затронутые версии
Все версии 3.x ниже 3.0.1.5 и 3.5.1.3
Исправленная версия
3.0.1.5 и 3.5.1.3