VPLEX:ストレージ ボリュームが縮退とマークされ、その後マークがクリアされる

モデレーター
モデレーター

VPLEX:ストレージ ボリュームが縮退とマークされ、その後マークがクリアされる

ナレッジベース記事:000518037

プライマリ製品:VPLEXシリーズ 製品:VPLEXシリーズ、VPLEX VS2、VPLEX Metro、VPLEX GeoSynchrony 5.4 Service Pack 1、VPLEX GeoSynchrony 5.4 Service Pack 1パッチ1、VPLEX GeoSynchrony 5.4 Service Pack 1パッチ3、VPLEX GeoSynchrony 5.4 Service Pack 1パッチ4
バージョン:5
記事タイプ:不具合修正
対象読者:レベル30 = お客様
最終発行日:2018年8月21日火曜日12:39:04(GMT)
サマリー:
ストレージ ボリュームが高い頻度で縮退とマークされ、その後しばらくして断続的にクリアと表示されます。
問題:
クラスタ ステータスは、「cluster status」の出力と「storage-volume summary」の出力で、縮退ボリュームの発生を示しています。

VPlexcli:/> cluster status
Cluster cluster-1
operational-status: ok
transitioning-indications:
transitioning-progress:
health-state: degraded
health-indications: 1 degraded
storage-volumes local-com: ok
 
VPlexcli:/> storage-volume summary
SUMMARY (cluster-1) StorageVolume Name IO Status Operational Status Health State
------------------- -----test-1 alive degraded degraded
 
Storage-Volume Summary H Tier L Tier (no tier) Total
 
Health out-of-date 0 out-of-date 0 out-of-date 0 out-of-date 0 storage-volumes 53 storage-volumes 2 storage-volumes 280 storage-volumes 335 unhealthy 0 unhealthy 0 unhealthy 1 unhealthy 1 Vendor DGC 53 DGC 2 DGC 280 DGC 335 Use used 53 used 2 meta-data 4 meta-data 4 unclaimed 3 unclaimed 3 used 273 used 328 Capacity total 20.7T total 51G total 112T total 133T

 

When listing the degraded volumes, the health indication shows degraded read/write latency

 

VPlexcli:/> ll clusters/cluster-1/storage-elements/storage-volumes/test-1/ /clusters/cluster-1/storage-elements/storage-volumes/test-1:
Name Value ----------------------------- ------------------------------------------------ application-consistent false block-count 2621440
block-size 4K capacity 10G description - free-chunks [] health-indications [Director director-1-1-A reports degraded-read-latency] health-state degraded io-status alive itls 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, 0x500014xxxxxxxxxx/0x500601xxxxxxxxxx/6, ... (16 total) largest-free-chunk 0B locality - operational-status ok provision-type legacy storage-array-name EMC-CLARiiON-APM00xxxxxxxxx storage-volumetype normal system-id VPD83T3:60060xxxxxxxxxxxxxxxxxxxxxxxxx thin-capable false thin-rebuild false total-free-space 0B underlying-storage-block-size 512 use used used-by [extent_test-1_1] vendor-specific-name DGC
 
同じ「cluster status」コマンドと「storage-volume summary」コマンドをもう一度実行すると、しばらくして、縮退ボリュームが表示されなかったり、以前とは異なる縮退ボリュームが表示されたりします。 ファームウェア ログをチェックすると、縮退と報告されたLUNに対して、イベントAMF/249とAMF/250が報告されています。これは、縮退の原因がパフォーマンス ポリシーの制限超過であることを表しています。レイテンシが許容範囲内に戻ると、縮退ステータスはクリアされます。
128.221.252.38/cpu0/log:5988:W/"00601660dd49152453-1":104786:<4>2018/02/17 15:30:14.45: amf/249 Amf test-1 performance has degraded. Average write I/O latency increased from 0.0 milliseconds to 208.431 milliseconds, which is above the acceptable limit of 200 milliseconds. 128.221.252.38/cpu0/log:5988:W/"00601660dd49152453-1":104787:<6>2018/02/17 15:35:14.59: amf/250 Amf test-1 performance is now acceptable. Average write I/O latency decreased from 208.431 milliseconds to 0.0 milliseconds, which is below the threshold of 20 milliseconds.
LUNの縮退が宣言された後、読み取りレイテンシと書き込みレイテンシの最大閾値は、以下に示すように、パフォーマンス ポリシーの制限事項に基づきます。
VPlexcli:/clusters/cluster-1/performance-policies> ll Name Enabled ---------------------- ------- storage-volume-latency true VPlexcli:/clusters/cluster-1/performance-policies> ll storage-volume-latency/ /clusters/cluster-1/performance-policies/storage-volume-latency: Name Value --------------------- ----- average-read-latency 20ms average-write-latency 20ms enabled true maximum-read-latency 200ms maximum-write-latency 200ms sampling-period 5min
原因:
バージョン5.5より前のGeoSynchronyの場合、ストレージ ボリュームの縮退は実際のタイムアウトに基づいて宣言されていました。具体的に説明すると、連続する3分間の期間が2回あり、その間に8回以上SCSIタイムアウトが検出された場合などです。 GeoSynchrony 5.5以降では、ストレージ ボリュームのパフォーマンス ポリシーが導入され(デフォルトで有効)、ストレージ ボリュームは以下の条件に基づいて縮
退とマークされるようになりました(VPLEX 5.5.x以降の『VPLEX Administration Guides』で「Storage volume degradation and restoration」を参照)。 以下の表は、この管理ガイドには含まれていません。
解決策:
ストレージ ボリュームのパフォーマンス ポリシーによると、LUNがレイテンシの閾値(管理ガイドの説明どおりデフォルトは200ミリ秒)を超えると縮退と宣言されます。また、LUNが許容制限内に戻ると再び縮退はクリアされます。 この変化の中でも、VPLEXは想定どおりに正常に動作します。 レイテンシの考えられる原因については、バックエンド アレイ チームに確認してください。 ストレージ ボリュームのパフォーマンス ポリシーを変更するには、(clusters/cluster-x/performance-policies/storage-volume-latency) コンテキスト内からコマンド「set」を使用します。 以下のガイドラインを遵守する必要があります。
 VPLEXは、システムでサポートされるすべてのアプリケーションの最大レイテンシ要件セットから最も低い値を取得し、読み取りまたは書き込みの最大レイテンシを選択します。VPLEXはこの仕組みにより、最もパフォーマンスが重視されるアプリケーションのニーズに基づいて、パフォーマンスをレポートできます。
 VPLEXは、システムでサポートされるすべてのアプリケーションの平均レイテンシ要件セットから最も高い値を取得し、読み取りまたは書き込みの平均レイテンシを選択します。
 パフォーマンス データを高い頻度でサンプリングすると、VPLEXシステムがビジー状態になる可能性があります(特に拡張セットアップの場合)。したがって、サンプリング期間を3~5分未満に設定する場合は、十分に注意するようにしてください。
 Metro環境では、両方のVPLEXクラスタで設定が同じになっていることを確認してください。同じ値であれば、分散ボリュームのためにVPLEXはシステムとして正しく動作するようになります。
注:
5.3.x以前のVPLEX GeoSynchronyの場合、コード レベルがEOSL(サポート終了)になっています。 VPLEX GeoSynchrony 5.4.xは、2018年4月30日現在で販売終了になっています。 EOSLまたはEOLのいずれかのコード バージョンで実行している場合は、GeoSynchrony 5.5以降にアップグレードする必要があります。

バージョン履歴
改訂番号
1/1
最終更新:
‎03-26-2019 12:45 AM
更新者:
 
寄稿者: