PowerScale: Problemas de memoria insuficiente causados por el drenaje de BTL del diario

Summary: Es posible que los nodos experimenten problemas relacionados con la falta de memoria (OOM) que causan estados de alarma, bajo rendimiento, falta de respuesta o tiempos de espera agotados. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Es posible que los nodos entren en estado de alarma y se reinicien con errores similares a los siguientes:

panic @ time 1674259428.301, thread 0xfffffea7dd044080: Journal BTL drain on buf
 0xfffffe83960ac990 failed due to timeout. BTL was held by transaction (22:114717860870)
 [0xfffff82523313920] tracking: getblk_core
BTL count: 0
Magic: 0x816a0fef
time = 1674259428
cpuid = 25, TSC = 0xe9721183172719
Panic occurred in module kernel loaded at 0xffffffff80200000:

Stack: --------------------------------------------------
kernel:jt_btl_timeout+0x2c7
kernel:j_getblk+0x523
kernel:lbm_getblk+0x5e
kernel:dev_local_write_block+0x293
kernel:dev_local_write_blocks+0xee
kernel:handle_write_blocks+0x4bb
kernel:efsidp_call_handler+0x20d
kernel:dxt_main+0xb13
kernel:kt_main+0x29e
kernel:fork_exit+0x82
--------------------------------------------------

Los registros contienen numerosos mensajes de OOM que indican condiciones de poca memoria:

OOM: v_wire_count: 10885052, v_active_count: 608 events_since_last_log 110
Malloc Pigs:
Type                   InUse   MemUse   Requests
8kB dinodes          2154597 3070318K 77501434068
devbuf                171110  646747K  606268226
isi_hash              193633  358194K  711844002
iaddr_set            3139278  196205K 17841421929
newblk                    16  131075K    1967260
inodedep                  17   65541K     921588
vfscache                   4   32961K          4
bar_owner_vec259         254   32176K     226961
linux                 168040   27951K  532146137
pp_actor               36696   27625K 5670886744
cred                   23116   26417K 15281662709
pcb                      155   24593K    2298737
lbm super               4476   21480K     691594
crc_vec200             22477   21194K  683805706
pagedep                    8   16385K     113021
Unshown bins account for 167623K
Total: 4866478K
UMA Zalloc Pigs:
NAME              SIZE      LIMIT      COUNT   MEM USED
VNODE             576,         0,   2167044,   1732868K
IFSINODE          584,         0,   2156921,   1731288K
VM OBJECT         272,         0,   2225166,    883916K
lki_lin_ent       224,         0,   2115660,    626924K
stat_cache        192,         0,   1897270,    548120K
mbuf_jumbo_p     4096,         0,     41027,    385152K
lki_ref_ent       128,         0,   2123131,    317108K
RADIX NODE        144,         0,   1070740,    301116K
lkc_gen_ent        64,         0,   3619684,    299996K
UMA Slabs 0        80,         0,   3034177,    242764K
ifm_attr_cac       80,         0,   2135049,    230628K
256 Bucket       2048,         0,     48259,    224540K
BUF TRIE          144,         0,    337738,    217204K
lkc_lin_idds       80,         0,   1694513,    182992K
lkc_ref_idds       72,         0,   1694878,    162560K
Top zones:         8087176K
Malloc zones:     16001068K
Other zones:       1365976K
UMA total:        25454220K

 

Es posible que Vnode Recycler ya esté habilitado en el clúster, pero es posible que persistan los problemas de falta de memoria. Consulte el siguiente artículo.

Isilon: PowerScale: OneFS 8.2 y versiones posteriores: Permite renunciar a vnodes libres para nuevos vnodes cuando la caché está llena.
 

Cause

El reciclaje de Vnode puede retrasarse y no liberar memoria lo suficientemente rápido como para mantenerse un paso adelante de las crecientes demandas de memoria.

Resolution

Se implementaron mejoras de código en las siguientes versiones de OneFS:

  • OneFS 9.2.1.15
  • OneFS 9.4.0.17
  • OneDS 9.5.0.7


Las versiones de Onefs lanzadas después de la anterior señalaron que las versiones también contienen las mismas mejoras de código. 

 

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000221837
Article Type: Solution
Last Modified: 10 May 2024
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.