VxRail: Solmuissa voi esiintyä suurta LSOM-ruuhkaa

Summary: VxRail-solmuissa 4.7.511-526 ja 7.0.130-132 saattaa esiintyä suurta muistiruuhkaisuutta, joka johtaa suorituskykyyn ja mahdollisiin vSAN-katkoksiin. Ongelman aiheuttavien palvelujen käytöstä poistamiseen on olemassa kiertotapa. Päivitys versioon 4.7.530/7.0.200 korjaa ongelman. Perustuu VMwaren tietämyskannan artikkeliin 82619 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Huomautus: annetut tiedot perustuvat VMware KB 82619Tämä hyperlinkki johtaa Dell Technologiesin ulkopuoliseen sivustoon.-artikkeliin (ulkoinen linkki). Tarkista artikkelista mahdolliset uudemmat päivitykset.

Kun käytössä on VxRail-versiot 4.7.511-526 ja 7.0.130-132, saatat kohdata seuraavia ongelmia:

  • "Toimitustaulukoiden elementtien määrä" on yli 100k, eivätkä ne vähene tuntien kuluessa.
  • Mahdollisuus nähdä vSAN-tietosäilön tiedostoja ja kansioita ei ole enää
  • Vakava suorituskyvyn heikkeneminen
  • Yksi tai useampi solmu, jossa esiintyy suurta LSOM (Local Log Structured Object Management) -muistin ruuhkautumista (katso komento 1).
  • "Elementtien määrä toimitustaulukoissa" on yli 100k (katso komento 2).
  • Muistin ruuhkautuminen, joka on levinnyt kaikkiin klusterin solmuihin.
  • Kirjaa viestit vmkernel.log:
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • Kirjaa viestit vobd.log ja vmkernel.log
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

Seuraavilla komentosarjakomennoilla voidaan selvittää, onko isännässä tämä ongelma.
Käsikirjoitus 1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

Mallituotos

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

Käsikirjoitus 2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

Näytetulos
(tämä koskee vain välimuistilevyjä; voit ohittaa kaikki kapasiteettilevyjen tulokset)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

Pesurikokoonpanon arvoja on muutettu vSAN 6.7 P04- ja vSAN 7.0 U1 P02 -versioissa objektien puhdistamiseksi useammalla taajuudella. Tämä muutos johtaa kunkin kohteen jatkuvaan pesurin etenemiseen aiempaa useammin. Jos klusterissa on käyttämättömiä objekteja, pesuri kerää näiden objektien vahvistustaulukkomerkinnät LSOM:iin. Lopulta kertyminen johtaa LSOM-muistin ruuhkautumiseen.

Käyttämättömillä objekteilla tarkoitetaan tässä yhteydessä objekteja, jotka eivät liity toisiinsa ja joihin ei ole kytketty virtuaalikoneita, replikoituja objekteja ja niin edelleen.

Resolution

Pitkän aikavälin ratkaisu: päivitä versioon 4.7.530 tai uudempaan tai versioon 7.0.200 tai uudempaan

Jos isännällä on suuri määrä elementtejä toimitustaulukoissa komentosarjan 2 määritetyllä tavalla, suosittelemme jompaakumpaa seuraavista vaiheista ruuhkautumisen poistamiseksi.
  1. Aseta ongelmaisäntä huoltotilaan Varmista käytettävyys -toiminnolla ja käynnistä isäntä uudelleen.
  2. Poista kunkin isännän levyryhmät ja liitä ne uudelleen Varmista käytettävyys -toiminnolla.
Tämä on ehkä tehtävä useissa klusterin solmuissa yksi kerrallaan.

Workaround:
Jos päivitys ei onnistu, ota toistaiseksi käyttöön seuraavat lisäasetusten muutokset ongelman estämiseksi.
  1. Vaihda pesuritaajuus yhteen kertaan vuodessa:
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. Poista käytöstä pesurin kestoajastin:
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Affected Products

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Products

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Article Properties
Article Number: 000196966
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.