「VxRail:ノードでLSOMの輻輳が発生する可能性がある

Summary: 4.7.511~526および7.0.130~132のVxRailノードでは、メモリーの輻輳が発生し、パフォーマンスが低下して、vSANが停止する可能性があります。回避策として、問題の原因となっているサービスを無効にします。また、4.7.530/7.0.200にアップグレードすると、この問題は解決されます(VMware KB 82619に基づく)。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

メモ:VMware KB 82619このハイパーリンクをクリックすると、デル・テクノロジーズ以外のWebサイトにアクセスします。(外部リンク)に基づいて提供される情報です。新しいアップデートの可能性については、記事を確認してください。

VxRailバージョン4.7.511-526および7.0.130-132を実行すると、次の問題が発生する可能性があります。

  • 「コミット テーブル内の要素数」が10万を超え、時間の経過とともに減少しない。
  • vSANデータストア上のファイルとフォルダーが表示されない。
  • パフォーマンスが著しく低下する。
  • Local Log Structured Object Management(LSOM)のメモリー輻輳が高いことを示すノードが1つ以上あります(コマンド1を参照)。
  • 「コミット テーブル内の要素数」が10万を超える(コマンド2を参照)。
  • メモリー輻輳がクラスター内のすべてのノードに伝播される。
  • vmkernel.logに次のメッセージが記録される。
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • vobd.logおよびvmkernel.logに次のメッセージが記録される。
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

次のスクリプト コマンドを使用して、ホストでこの問題が発生しているかどうかを判断できます。
スクリプト1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

出力例

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

スクリプト2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

出力例
(これはキャッシュ ディスクのみです。容量ディスクの結果は無視できます)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

vSAN 6.7 P04およびvSAN 7.0 U1 P02リリースでは、より高い頻度でオブジェクトをスクラブするため、スクラバー構成値が変更されました。この変更により、各オブジェクトのスクラバーの進行が以前よりも頻繁に持続します。クラスター内にアイドル状態のオブジェクトがある場合、スクラバーはこれらのオブジェクトに対するコミット テーブル エントリーをLSOMに蓄積します。最終的に、この蓄積によってLSOMメモリーの輻輳が発生します

このコンテキストでのアイドル オブジェクトとは、関連づけられていないオブジェクト、電源がオフになっているVM、レプリケートされたオブジェクトなどを指します。

Resolution

長期的な解決策:4.7.530以降または7.0.200以降にアップデートします

スクリプト2に示すように、ホストのコミット テーブル内の要素の数が多い場合は、輻輳を解消するために次の2つの手順のいずれかを実行することをお勧めします。
  1. 問題のあるホストを「Ensure Accessibility」でメンテナンス モードにしてから、ホストを再起動します。
  2. Ensure Accessibilityを使用して、各ホストのディスク グループをアンマウントして再マウントします。
クラスター内の複数のノードで一度に1つずつこれを行う必要がある場合があります。

回避策:
アップグレードできない場合でも、現時点では、この問題の発生を軽減するために、次の詳細設定の変更を実装します。
  1. スクラバーの頻度を 年に1回に変更します。
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. スクラバー保持タイマーを無効にします。
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Affected Products

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Products

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Article Properties
Article Number: 000196966
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.