VxRail: Los nodos pueden experimentar una alta congestión de LSOM

Summary: Los nodos de VxRail delas versiones 4.7.511-526 y 7.0.130-132 pueden experimentar una alta congestión de la memoria que conduce a interrupciones de rendimiento y posibles interrupciones de vSAN. Existe una solución alternativa para desactivar los servicios que causan el problema; la actualización a la versión 4.7.530 o 7.0.200 resuelve este problema. Basado en el artículo de la base de conocimientos de VMware 82619 ...

Αυτό το άρθρο ισχύει για Αυτό το άρθρο δεν ισχύει για Αυτό το άρθρο δεν συνδέεται με κάποιο συγκεκριμένο προϊόν. Δεν προσδιορίζονται όλες οι εκδόσεις προϊόντων σε αυτό το άρθρο.

Symptoms

Nota: La información proporcionada se basa en VMware KB 82619Este hipervínculo lo redirige a un sitio web fuera de Dell Technologies.(enlace externo). Revise el artículo para ver si hay posibles actualizaciones más recientes.

Cuando se ejecutan las versiones 4.7.511-526 y 7.0.130-132 de VxRail, es posible que experimente los siguientes problemas:

  • “Number of elements in the commit tables” es superior a 100 000 y no disminuye durante un período de horas.
  • Pérdida de capacidad para ver archivos y carpetas en el almacén de datos de vSAN
  • Degradación grave del rendimiento
  • Uno o más nodos presentan una alta congestión de la memoria en la administración de objetos estructurados de registro local (LSOM) (consulte el comando 1).
  • “Number of elements in the commit tables” es superior a 100 000 (consulte el comando 2).
  • Congestión de memoria que se ha propagado a todos los nodos del clúster.
  • Mensajes de registro en vmkernel.log:
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • Mensajes de registro en vobd.log y vmkernel.log
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

Los siguientes comandos en secuencia se pueden utilizar para determinar si el host puede estar experimentando este problema.
Secuencia 1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

Resultado de muestra

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

Secuencia 2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

Ejemplo de salida
(esto es solo en discos de caché; puede ignorar cualquier resultado de discos de capacidad)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

Los valores de configuración de depuración se modificaron en las versiones vSAN 6.7 P04 y vSAN 7.0 U1 P02 para limpiar objetos con una mayor frecuencia. Este cambio da como resultado un progreso persistente del depurador de cada objeto con más frecuencia que antes. Si hay objetos inactivos en el clúster, el limpiador acumula entradas de la tabla de confirmación para estos objetos en LSOM. Finalmente, la acumulación provoca una congestión de la memoria de LSOM.

En este contexto, los objetos inactivos hacen referencia a objetos no asociados, máquinas virtuales apagadas, objetos replicados, etc.

Resolution

Resolución a largo plazo: actualice a 4.7.530 o posterior o a 7.0.200 o posterior

Si un host tiene una gran cantidad de elementos en las tablas commit, como se determina en el script 2, se recomienda uno de los dos pasos siguientes para eliminar la congestión.
  1. Coloque el host con problemas en modo de mantenimiento con Ensure Accessibility y, a continuación, reinicie el host.
  2. Desmonte y vuelva a montar los grupos de discos de cada host mediante Ensure Accessibility.
Es posible que deba hacer esto en varios nodos, uno a la vez, en el clúster.

Solución:
Si no puede actualizar, implemente los siguientes cambios avanzados en la configuración para evitar que se produzca este problema.
  1. Cambie la frecuencia de depuración a una vez al año:
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. Desactive el temporizador de persistencia de la depuración:
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Επηρεαζόμενα προϊόντα

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Προϊόντα

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Ιδιότητες άρθρου
Article Number: 000196966
Article Type: Solution
Τελευταία τροποποίηση: 17 Δεκ 2025
Version:  3
Βρείτε απαντήσεις στις ερωτήσεις σας από άλλους χρήστες της Dell
Υπηρεσίες υποστήριξης
Ελέγξτε αν η συσκευή σας καλύπτεται από τις Υπηρεσίες υποστήριξης.