PowerFlex:レプリケーション使用時のクライアントIOエラー

Summary: クライアント/サーバーで、PowerFlexベースのデバイスに対してIOエラーが発生しています。全体的なバックエンド(MDM/SDSes)は正常であると考えられます。PowerFlexレプリケーションが使用されており、1つ以上のRCGに対してRPOエラーが発生しています。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • 容量の低下または障害の発生なし
  • SDSが分離されていないか、SDSデバイスがエラーを報告していません。
  • 切断されたMDMはありません

レプリケーション機能が使用されています。
次のエラーを報告するUIの1つ以上のアラート:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDMイベント ログでは、次のことが報告される場合があります。
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

問題 

クライアントは、レプリケーションのためにインターセプトされたボリュームにアクセスできません。


Cause

まれなソフトウェアの不具合が、ジャーナル容量に関連する内部カウンターでMDMとSDRコンポーネントが一致しない場合に発生する可能性があります。この不一致により、SDRの容量がいっぱいになったときにMDMが追加のジャーナル容量を割り当て解除し、PowerFlexによってバックアップされたデバイスを使用しているクライアント/サーバーでIOエラーが発生する可能性があります。

Resolution

この問題を解決するには、すべてのSDRコンポーネントのローリング再起動が必要であり、ソース システム上のMDM所有権を切り替える必要があります。

SDRコンポーネントを再起動します。

1)すべてのSDRを特定します。

scli --query_all_sdr

2)SDRでメンテナンス モードに入ります。

scli --enter_sdr_maintenance_mode --sdr_name <name>

3)ステップ1のコマンドを実行して、SDRが完全にメンテナンス モードになっていることを確認します。

4)SDRコンポーネントを再起動します。

pkill sdr

5)ソース サイトのすべてのSDRに対してこれを繰り返します。
 

すべてのSDRが再起動したら、MDM所有権を切り替えます。

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*必要に応じて、所有権を元のMDMサーバーに戻すことができます。

クライアント/サーバー上のIOエラーが報告されなくなったことを確認します。クライアントが読み取り専用ファイル システムに入った場合は、クライアント/サーバーの再起動が必要になる場合があります。

原因を特定できるまでは、ソース システム上のすべてのRCGを終了することもお勧めします。

上記の手順を適用した後もIOエラーが続く場合は、PowerFlexエンジニアリングにお問い合わせください。

Additional Information

問題が発生するバージョン

PowerFlex 3.x

PowerFlex 4.x

修正バージョン

PFMPの4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.