VxRail:節點可能會遇到高 LSOM 壅塞

Summary: 從 4.7.511-526 和 7.0.130-132 的 VxRail 節點可能會遇到高記憶體壅塞,導致效能和可能的 vSAN 中斷。因應措施是停用導致此問題的服務;升級至 4.7.530/7.0.200 可解決此問題。以 VMware KB 82619 為基礎

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

注意:根據 VMware KB 82619此超連結會帶您前往 Dell Technologies 以外的網站。提供的資訊 (外部連結)。檢閱文章是否有任何潛在的較新更新。

執行 VxRail 版本 4.7.511-526 和 7.0.130-132 時,您可能會遇到下列問題:

  • 「認可表中的元素數目」超過 10 萬個,且在一段時間內不會減少。
  • 無法看到在 vSAN 資料存放區上的檔案和資料夾
  • 嚴重效能降低
  • 一或多個節點呈現高本機記錄結構化物件管理 (LSOM) 記憶體壅塞 (請參閱命令 1)。
  • 「認可表中的元素數目」超過 10 萬 (請參閱命令 2)。
  • 已傳播至叢集中所有節點的記憶體壅塞。
  • 在 vmkernel.log 中的記錄訊息:
    • LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.
  • 在 vobd.log 和 vmkernel.log 中的記錄訊息
    • LSOM_ThrowAsyncCongestionVOB:1669: LSOM Memory Congestion State: Exceeded. Congestion Threshold: 200 Current Congestion: 204.

下列指令檔式命令可用來判斷主機是否遇到此問題。
指令檔 1

while true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F : '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F : '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal + $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;

範例輸出

Fri Feb 12 06:40:51 UTC 2021  

529dd4dc--xxxx-xxxx-xxxx-xxxxxxxxxxxx
   memCongestion:0 >> This value is higher than 0 ( ranger 0-250 )
   slabCongestion:0
   ssdCongestion:0
   iopsCongestion:0
   logCongestion:0
   compCongestion:0
   memCongestionLocalMax:0
   slabCongestionLocalMax:0
   ssdCongestionLocalMax:0
   iopsCongestionLocalMax:0
   logCongestionLocalMax:0
   compCongestionLocalMax:0
529dd4dc-xxxx-xxxx-xxxx-xxxxxxxxxxxxxx
    LLOG consumption: 0.270882
    PLOG consumption: 0.632553
    Total log consumption: 0.903435

指令檔 2

vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"

範例輸出
(僅限快取磁碟;您可以忽略容量磁碟的任何結果)

52f395f3-03fd-f005-bf02-40287362403b/   Number of elements in commit tables:300891
526709f4-8790-8a91-2151-a491e2d3aec5/   Number of elements in commit tables:289371



 

Cause

清除程式組態值已在 vSAN 6.7 P04 和 vSAN 7.0 U1 P02 版本中修改,以更高的頻率清除物件。此變更會導致每個物件的持續性清除進度比之前更頻繁。如果叢集中有閒置物件,則清除程式會在 LSOM 中累積這些物件的認可表格項目。最終,累積會導致 LSOM 記憶體壅塞。

此上下文中的空閒物件是指未關聯、已關閉電源的虛擬機、複製的物件等物件。

Resolution

長期解決方案:更新至 4.7.530 或更新版本或 7.0.200 或更新版本

如果主機的認可表中有大量元素 (如指令檔 2 中所判斷),建議執行下列兩個步驟之一來清除壅塞。
  1. 讓問題主機進入維護模式,並確保存取功能,然後重新啟動主機。
  2. 使用確保存取功能取消掛接再重新掛接每個主機的磁碟群組。
您可能必須在群集中的多個節點上一次執行一個節點執行此操作。

因應措施:
如果無法升級,目前仍會實施下列進階設定變更,以避免發生此問題。
  1. 將清除程式頻率變更 為每年一次:
esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear​​​​
  1. 停用清除程式持續計時器
esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin

Affected Products

VxRail, VMWare Cloud on Dell EMC VxRail E560F, VMWare Cloud on Dell EMC VxRail E560N, VxRail 460 and 470 Nodes, VxRail Appliance Family, VxRail Appliance Series, VxRail D Series Nodes, VxRail D560, VxRail D560F, VxRail E Series Nodes

Products

VxRail G410, VxRail G Series Nodes, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF , VxRail Gen2 Hardware, VxRail P Series Nodes, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF, VxRail P675F, VxRail P675N, VxRail S Series Nodes, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail Software, VxRail V Series Nodes, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF ...
Article Properties
Article Number: 000196966
Article Type: Solution
Last Modified: 17 Dec 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.