PowerFlex: 복제를 사용 중일 때 클라이언트 IO 오류

Summary: 클라이언트/서버에서 PowerFlex 지원 디바이스에 대한 IO 오류가 발생합니다. 전체 백엔드(MDM/SDS)가 정상인 것으로 나타납니다. PowerFlex 복제를 사용 중이며 1개 이상의 RCG에 대한 일부 RPO 오류가 있습니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • 성능 저하 또는 장애가 발생한 용량 없음
  • SDS가 분리되었거나 오류를 보고하는 SDS 디바이스가 없습니다.
  • 연결이 끊긴 MDM 없음

복제 기능을 사용 중입니다.
다음 오류를 보고하는 하나 이상의 UI 알림:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM 이벤트 로그는 다음을 보고할 수 있습니다.
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

영향 

클라이언트는 복제를 위해 가로챈 볼륨에 액세스할 수 없습니다.


Cause

저널 용량과 관련된 내부 카운터에서 MDM과 SDR 구성 요소가 일치하지 않는 소프트웨어 결함이 드물게 발생할 수 있습니다. 이러한 불일치로 인해 SDR의 용량이 가득 찼을 때 MDM에서 추가 저널 용량을 할당하지 않을 수 있으며, 이로 인해 PowerFlex가 지원하는 디바이스를 사용하는 클라이언트/서버에서 IO 오류가 발생할 수 있습니다.

Resolution

모든 SDR 구성 요소를 점진적으로 재시작해야 하며 이 문제를 해결하려면 소스 시스템의 MDM 소유권을 전환해야 합니다.

SDR 구성 요소 재시작:

1) 모든 SDR을 식별합니다.

scli --query_all_sdr

2) SDR에서 유지 보수 모드로 전환합니다.

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) 1단계의 명령을 실행하여 SDR이 완전히 유지 보수 모드에 있는지 확인합니다.

4) SDR 구성 요소를 재시작합니다.

pkill sdr

5) 소스 사이트의 모든 SDR에 대해 이 작업을 반복합니다.
 

모든 SDR이 재시작되면 MDM 소유권을 전환합니다.

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*원하는 경우 소유권을 원래 MDM 서버로 다시 이전할 수 있습니다.

클라이언트/서버의 IO 오류가 더 이상 보고되지 않는지 확인합니다. 클라이언트가 읽기 전용 파일 시스템을 시작한 경우 클라이언트/서버를 재부팅해야 할 수 있습니다.

원인을 파악할 때까지 소스 시스템의 모든 RCG를 종료하는 것이 좋습니다.

위의 단계를 적용한 후에도 IO 오류가 계속되면 PowerFlex 엔지니어링에 문의하십시오.

Additional Information

영향을 받는 버전

PowerFlex 3.x

PowerFlex 4.x

수정된 버전

PFMP 4.5.3 버전

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.