VxRail: Noder kan uppleva hög LSOM-trängsel

Summary: VxRail-noder från 4.7.511-526 och 7.0.130-132 kan uppleva hög minnesbelastning, vilket leder till prestanda och möjliga vSAN-avbrott. Det finns en tillfällig lösning för att inaktivera tjänster som orsakar problemet. Uppgradering till 4.7.530/7.0.200 löser problemet. Baserat på VMware KB 82619 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Informationen är baserad på VMware KB 82619Den här hyperlänken tar dig till en webbplats utanför Dell Technologies.(Extern länk). Läs artikeln för eventuella nyare uppdateringar.

När du kör VxRail-versionerna 4.7.511-526 och 7.0.130-132 kan du få följande problem:

  • "Antal element i incheckningstabellerna" är mer än 100 k och minskar inte under en period på flera timmar.
  • Förlust av möjlighet att visa filer och mappar i vSAN-datalagret
  • Allvarlig prestandaförsämring
  • En eller flera noder som uppvisar hög överbelastning av LSOM-minne (Local Log Structured Object Management) (se kommando 1).
  • "Antal element i incheckningstabellerna" är mer än 100 k (se kommando 2).
  • Minnesbrist som har spridits till alla noder i klustret.
  • Loggar meddelanden i vmkernel.log:
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • Loggar meddelanden i vobd.log och vmkernel.log
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

Följande skriptkommandon kan användas för att avgöra om värden har det här problemet.
Skript 1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

Exempel på utdata

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

Skript 2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

Exempelutdata
(detta gäller endast på cachediskar; du kan ignorera eventuella resultat av kapacitetsdiskar)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

Indikatorkonfigurationsvärdena ändrades i versionerna vSAN 6.7 P04 och vSAN 7.0 U1 P02 för att skrubba objekt med högre frekvens. Den här ändringen resulterar i beständig skrubbningsförlopp för varje objekt oftare än tidigare. Om det finns inaktiva objekt i klustret ackumulerar indikatorn incheckningstabellposter för dessa objekt på LSOM. Så småningom leder ackumuleringen till överbelastning av LSOM-minnet.

Inaktiva objekt i det här sammanhanget refererar till objekt som är oassocierade, avstängda virtuella datorer, replikerade objekt och så vidare.

Resolution

Långsiktig lösning: uppdatera till 4.7.530 eller senare eller 7.0.200 eller senare

Om en värd har ett stort antal element i incheckningstabellerna, enligt vad som bestäms i skript 2, rekommenderas ett av följande två steg för att rensa överbelastningen.
  1. Sätt problemvärden i underhållsläge med säkerställ tillgänglighet och starta sedan om värden.
  2. Demontera och återmontera varje värds diskgrupper med hjälp av funktionen för att säkerställa tillgänglighet.
Du kan behöva göra detta på flera noder en i taget i klustret.

Workaround:
Om det inte går att uppgradera implementerar du följande avancerade inställningsändringar för att förhindra att problemet uppstår.
  1. Ändra scrubbningsfrekvensen till en gång per år:
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. Avaktivera indikatorns beständighetstimer:
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Affected Products

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Products

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Article Properties
Article Number: 000196966
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.