PowerFlex: Помилки виводу клієнта під час використання реплікації

Summary: Клієнти/сервери стикаються з помилками виводу на пристроях з підтримкою PowerFlex. Загальний бекенд (MDM/SDS) виглядає здоровим. Використовується реплікація PowerFlex, і є деякі помилки RPO щодо одного або більше RCG. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Відсутність деградації чи виходу з ладу
  • Жодних від'єднаних SDS або SDS-пристроїв, що повідомляють про помилки.
  • Немає від'єднаних MDM

Використовується функція реплікації.
Один або кілька сповіщень у інтерфейсі, які повідомляють про такі помилки:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Журнали подій MDM можуть повідомляти наступне:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Вплив 

Клієнти не можуть отримати доступ до томів, які перехоплюються для реплікації.


Cause

Рідкісний дефект програмного забезпечення може виникати, коли компоненти MDM і SDR не погоджуються щодо внутрішніх лічильників, пов'язаних із місткістю журналу. Ця розбіжність може призвести до того, що MDM не розподіляє додаткову ємність журналу, коли ємність SDR повна, що потенційно призводить до помилок IO на клієнтах/серверах, які використовують пристрої, підтримувані PowerFlex.

Resolution

Потрібен постійний перезапуск усіх компонентів SDR, а власність MDM на вихідній системі має бути переключена для вирішення проблеми.

Перезапусти компоненти SDR:

1) Ідентифікуйте всі SDR:

scli --query_all_sdr

2) Увійти в режим технічного обслуговування SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Перевірити, що SDR повністю перебуває в режимі підтримки, виконавши команду на кроці 1.

4) Перезапустити компонент SDR.

pkill sdr

5) Повторіть це для всіх SDR на вихідному сайті.
 

Після перезапуску всіх SDR змініть власність MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*За бажанням власність можна повернути на оригінальний сервер MDM.

Перевірте, що помилки IO на клієнті/серверах більше не повідомляються. Якщо клієнт увійшов у файлову систему лише для читання, клієнт/сервер може потребувати перезавантаження.

Поки не буде встановлено причину, також рекомендується припинити роботу всіх RCG у вихідній системі.

Якщо після застосування вищезазначених кроків помилки IO продовжуються, залучайте PowerFlex Engineering.

Additional Information

Впливові версії

PowerFlex 3.x

PowerFlex 4.x

Виправлено у версії

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.