PowerFlex. Ошибки клиентского ввода-вывода при использовании репликации
Summary: Клиенты/серверы сталкиваются с ошибками ввода-вывода на устройствах с поддержкой PowerFlex. В целом серверная часть (MDM/SDS) работает нормально. Используется репликация PowerFlex, и имеются ошибки целевой точки восстановления для 1 или нескольких RCG. ...
Symptoms
- Отсутствует пониженная производительность или сбой емкости
- Нет развязанных SDS или сообщений об ошибках устройств SDS.
- Без отключенных MDM
Используется функция репликации.
Одно или несколько оповещений в пользовательском интерфейсе сообщают о следующих ошибках:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededЖурналы событий MDM могут сообщать следующее:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Воздействие
Клиенты не могут получить доступ к томам, которые перехватываются для репликации.
Cause
Resolution
|
Для устранения проблемы требуется последовательный перезапуск всех компонентов SDR и смена владельца MDM в исходной системе. Перезапустите компоненты SDR: 1) Определите все СДР: scli --query_all_sdr 2) Войдите в режим обслуживания SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3. Убедитесь, что SDR полностью находится в режиме обслуживания, выполнив команду на шаге 1. 4) Перезапустите компонент SDR. pkill sdr 5. Повторите это для всех SDR на исходном сайте. После перезапуска всех SDR переключите владельца MDM: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> * При необходимости право собственности можно передать обратно на исходный сервер MDM. До тех пор, пока причина не будет выяснена, рекомендуется также завершить работу всех RCG в исходной системе. Если ошибки ввода-вывода не исчезли после выполнения указанных выше действий, обратитесь к инженерам PowerFlex. |
Additional Information
Затронутые версии
PowerFlex 3.x
PowerFlex 4.x
Исправлено в версии
ПФМП 4.5.3