PowerFlex: Помилки виводу клієнта під час використання реплікації
Summary: Клієнти/сервери стикаються з помилками виводу на пристроях з підтримкою PowerFlex. Загальний бекенд (MDM/SDS) виглядає здоровим. Використовується реплікація PowerFlex, і є деякі помилки RPO щодо одного або більше RCG. ...
Symptoms
- Відсутність деградації чи виходу з ладу
- Жодних від'єднаних SDS або SDS-пристроїв, що повідомляють про помилки.
- Немає від'єднаних MDM
Використовується функція реплікації.
Один або кілька сповіщень у інтерфейсі, які повідомляють про такі помилки:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededЖурнали подій MDM можуть повідомляти наступне:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Вплив
Клієнти не можуть отримати доступ до томів, які перехоплюються для реплікації.
Cause
Resolution
|
Потрібен постійний перезапуск усіх компонентів SDR, а власність MDM на вихідній системі має бути переключена для вирішення проблеми. Перезапусти компоненти SDR: 1) Ідентифікуйте всі SDR: scli --query_all_sdr 2) Увійти в режим технічного обслуговування SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Перевірити, що SDR повністю перебуває в режимі підтримки, виконавши команду на кроці 1. 4) Перезапустити компонент SDR. pkill sdr 5) Повторіть це для всіх SDR на вихідному сайті. Після перезапуску всіх SDR змініть власність MDM: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *За бажанням власність можна повернути на оригінальний сервер MDM. Поки не буде встановлено причину, також рекомендується припинити роботу всіх RCG у вихідній системі. Якщо після застосування вищезазначених кроків помилки IO продовжуються, залучайте PowerFlex Engineering. |
Additional Information
Впливові версії
PowerFlex 3.x
PowerFlex 4.x
Виправлено у версії
PFMP 4.5.3