VxRail. Узлы могут испытывать высокую перегрузку LSOM

Summary: Узлы VxRail версий 4.7.511-526 и 7.0.130-132 могут испытывать большие перегрузки памяти, приводящие к перебоям производительности и возможным простоям vSAN. Существует временное решение для отключения служб, вызывающих эту проблему; модернизация до версии 4.7.530/7.0.200 устраняет эту проблему. Основано на статье базы знаний VMware 82619 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Примечание. Информация предоставлена на основе базы знаний VMware 82619Эта гиперссылка позволяет перейти на сайт за пределами Dell Technologies.(внешняя ссылка). Просмотрите статью на наличие новых обновлений.

При использовании VxRail версий 4.7.511-526 и 7.0.130-132 могут возникнуть следующие проблемы:

  • «Количество элементов в таблицах применения» превышает 100 тыс. и не уменьшается в течение нескольких часов.
  • Потеря возможности просмотра файлов и папок в хранилище данных vSAN
  • Значительное ухудшение производительности
  • Один или несколько узлов демонстрируют высокую перегрузку памяти LSOM (Local Log Structured Object Management) (см. команду 1).
  • «Количество элементов в таблицах применения» превышает 100 тыс. (см. команду 2).
  • Перегрузка памяти, которая распространилась на все узлы кластера.
  • В журнале vmkernel.log появляются сообщения:
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • В журналах vobd.log и vmkernel.log появляются сообщения:
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

Следующие команды сценариев можно использовать для определения того, испытывает ли хост эту проблему.
Сценарий 1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

Пример вывода

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

Сценарий 2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

Пример выходных данных
(это относится только к кэш-дискам; любые результаты для дисков емкости можно игнорировать)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

Значения конфигурации очистки были изменены в версиях vSAN 6.7 P04 и vSAN 7.0 U1 P02 для более высокой частоты очистки объектов. Это изменение приводит к тому, что ход выполнения очистки каждого объекта сохраняется чаще, чем раньше. Если в кластере есть неактивные объекты, то программа очистки накапливает записи в таблице применения для этих объектов в LSOM. В конечном итоге накопление приводит к перегрузке памяти LSOM.

Под неактивными объектами в этом контексте понимаются несвязанные, выключенные виртуальные машины, реплицированные объекты и т. д.

Resolution

Долгосрочное решение: обновление до версии 4.7.530 или более поздней или 7.0.200 или более поздней

Если хост содержит большое количество элементов в таблицах фиксации, как определено в сценарии 2, для устранения перегрузки рекомендуется выполнить одно из двух следующих действий.
  1. Переведите проблемный хост в режим обслуживания с помощью функции обеспечения доступности, затем перезагрузите хост.
  2. Отключите и снова подключите группы дисков каждого хоста, с помощью функции обеспечения доступности.
Возможно, вам придется сделать это на нескольких узлах кластера по одному.

Решение:
Если не удается выполнить модернизацию, выполните следующие изменения дополнительных настроек, чтобы избежать возникновения этой проблемы.
  1. Измените частоту скрубберов на один раз в год:
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. Отключите таймер сохранения очистки:
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Affected Products

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Products

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Article Properties
Article Number: 000196966
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.