PowerFlex VMwareレプリケーションが原因でCPU使用率が高くなり、IOエラーが発生する
Summary: PowerFlex SDCを使用してVMwareレプリケーションを実行すると、ESXiホストで使用率が高くなり、IOエラーが発生します PowerFlexクラスターを使用したVMware Replicationを使用したVMの初期レプリケーション中に、ESXiホストでCPU使用率が高くなり、IOエラーが発生します。
Symptoms
- VMware レプリケーション 8.4 以前
- VM の初期レプリケーション
- レプリケートされた VM には多数の VMDK ディスク (15+) があります
- レプリケーションの開始時に VM がホストされている ESXi ホストの CPU 使用率が高い。
- PowerFlexクラスターからマッピングされたボリュームのレイテンシーは、レイテンシーが20〜30ミリ秒に増加し、場合によってはそれ以上になります。
- レプリケートされていない同じホスト上の他のVMでは、アプリケーションの観点からパフォーマンスやIOエラーが低下する可能性があります。
- 「esxtop」を含むディスク キューのビューには、ホストがバックエンド ボリュームへの IO 呼び出しをキューイングしていることがわかります。
- バックエンドコンポーネント(MDM/SDS)は安定しており、パフォーマンスの問題やエラーは見られません。
- VMをレプリケートするESXiホストに、レプリケーションの開始直後に次のメッセージが表示されます。
2021-05-19T17:58:08.413Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d4e0000001b performance has deteriorated. I/O latency increased from average value of 796 microseconds to 25965 microseconds.
2021-05-19T17:58:10.048Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba2944570000005d performance has deteriorated. I/O latency increased from average value of 799 microseconds to 26019 microseconds.
2021-05-19T17:58:12.060Z cpu70:2098596)WARNING: ScsiDeviceIO: 1564: Device eui.1309fbc714390806ba291d3d0000000a performance has deteriorated. I/O latency increased from average value of 676 microseconds to 23641 microseconds.
問題
アプリケーションの観点から見たパフォーマンスの低下とIOエラー
Cause
VMwareレプリケーションを使用したVMの初期レプリケーション中に、VMが構成した各.vmdkディスクのすべてのブロックのChecksumが実行されます。このチェックサム プロセス中に、IOはESXiホスト上のシングル スレッドを介して送信され、チェックサムIOがシリアル化されます。このスレッドは、ホスト上の他のIO目的にも使用されます。これにより、異常なCPU使用率とディスク レイテンシーが発生し、同じホスト上の他のVMの速度が低下します。
Resolution
VMwareは、VMwareレプリケーションの新しいバージョンでこれを修正しています。バージョンはまだ未定です。