PowerScale: Problemer med manglende hukommelse forårsaget af Journal BTL-dræning

Summary: Noder kan opleve OOM-relaterede problemer (Out Of Memory), der forårsager nodepanikker, lav ydeevne, manglende respons eller timeouts.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Noder kan gå i panik og genstarte med fejl, der ligner følgende:

panic @ time 1674259428.301, thread 0xfffffea7dd044080: Journal BTL drain on buf
 0xfffffe83960ac990 failed due to timeout. BTL was held by transaction (22:114717860870)
 [0xfffff82523313920] tracking: getblk_core
BTL count: 0
Magic: 0x816a0fef
time = 1674259428
cpuid = 25, TSC = 0xe9721183172719
Panic occurred in module kernel loaded at 0xffffffff80200000:

Stack: --------------------------------------------------
kernel:jt_btl_timeout+0x2c7
kernel:j_getblk+0x523
kernel:lbm_getblk+0x5e
kernel:dev_local_write_block+0x293
kernel:dev_local_write_blocks+0xee
kernel:handle_write_blocks+0x4bb
kernel:efsidp_call_handler+0x20d
kernel:dxt_main+0xb13
kernel:kt_main+0x29e
kernel:fork_exit+0x82
--------------------------------------------------

Logfilerne indeholder adskillige OOM-meddelelser, der angiver lave hukommelsesforhold:

OOM: v_wire_count: 10885052, v_active_count: 608 events_since_last_log 110
Malloc Pigs:
Type                   InUse   MemUse   Requests
8kB dinodes          2154597 3070318K 77501434068
devbuf                171110  646747K  606268226
isi_hash              193633  358194K  711844002
iaddr_set            3139278  196205K 17841421929
newblk                    16  131075K    1967260
inodedep                  17   65541K     921588
vfscache                   4   32961K          4
bar_owner_vec259         254   32176K     226961
linux                 168040   27951K  532146137
pp_actor               36696   27625K 5670886744
cred                   23116   26417K 15281662709
pcb                      155   24593K    2298737
lbm super               4476   21480K     691594
crc_vec200             22477   21194K  683805706
pagedep                    8   16385K     113021
Unshown bins account for 167623K
Total: 4866478K
UMA Zalloc Pigs:
NAME              SIZE      LIMIT      COUNT   MEM USED
VNODE             576,         0,   2167044,   1732868K
IFSINODE          584,         0,   2156921,   1731288K
VM OBJECT         272,         0,   2225166,    883916K
lki_lin_ent       224,         0,   2115660,    626924K
stat_cache        192,         0,   1897270,    548120K
mbuf_jumbo_p     4096,         0,     41027,    385152K
lki_ref_ent       128,         0,   2123131,    317108K
RADIX NODE        144,         0,   1070740,    301116K
lkc_gen_ent        64,         0,   3619684,    299996K
UMA Slabs 0        80,         0,   3034177,    242764K
ifm_attr_cac       80,         0,   2135049,    230628K
256 Bucket       2048,         0,     48259,    224540K
BUF TRIE          144,         0,    337738,    217204K
lkc_lin_idds       80,         0,   1694513,    182992K
lkc_ref_idds       72,         0,   1694878,    162560K
Top zones:         8087176K
Malloc zones:     16001068K
Other zones:       1365976K
UMA total:        25454220K

 

Vnode Recycler er muligvis allerede aktiveret på klyngen, men der kan fortsat være problemer med manglende hukommelse. Se følgende artikel.

Isilon: PowerScale: OneFS 8.2 og nyere: Tillad at opgive gratis vnoder til nye vnodes, når cachen er fuld.
 

Cause

Genbrug af Vnode kan sakke bagud og ikke frigøre hukommelse hurtigt nok til at være på forkant med de stigende hukommelseskrav.

Resolution

Der er implementeret kodeforbedringer i følgende OneFS-versioner:

  • OneFS 9.2.1.15
  • OneFS 9.4.0.17
  • OneDS 9.5.0.7


Onefs-versioner udgivet efter ovenstående bemærkede, at versioner også indeholder de samme kodeforbedringer. 

 

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000221837
Article Type: Solution
Last Modified: 10 May 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.