Isilon: Die /var/log-Meldungen auf einigen Nodes zeigen von Zeit zu Zeit Meldungen über unzureichenden Arbeitsspeicher an

Summary: Die /var/log-Meldungen auf einigen Nodes zeigen von Zeit zu Zeit diese OOM-Meldungen (Nicht genügend Arbeitsspeicher) an: OOM: v_wire_count: 2832982, v_active_count: 516

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

 Ein vollständiger Nachrichtensatz sieht folgendermaßen aus: 
2021-08-17T14:40:50.703082+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: OOM: v_wire_count: 2843879, v_active_count: 871
2021-08-17T14:40:50.703246+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Malloc Pigs:
2021-08-17T14:40:50.703277+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Type                   InUse   MemUse   Requests
2021-08-17T14:40:50.703303+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: 8kB dinodes           840507  647775K 13330759531
2021-08-17T14:40:50.703325+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: isi_hash               31424   88002K 1548035744
2021-08-17T14:40:50.703344+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: lbm super              17535   84150K    1435677
2021-08-17T14:40:50.703362+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: layout_hints          183473   57336K   22320273
2021-08-17T14:40:50.703379+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: iaddr_set             886694   55419K 5188138062
2021-08-17T14:40:50.703397+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: devbuf                 17379   37840K     184744
2021-08-17T14:40:50.703414+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: newblk                    26   32774K    2364548
2021-08-17T14:40:50.703432+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: bar_owner_vec259         261   32288K    2220148
2021-08-17T14:40:50.703451+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: parent_vec153         218013   27538K    4567646
2021-08-17T14:40:50.703475+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ddvec84               183471   22840K  177809736
2021-08-17T14:40:50.703496+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: inodedep                  22   16390K    1677902
2021-08-17T14:40:50.703515+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: sysctloid             201426   10989K     201598
2021-08-17T14:40:50.703535+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: vfscache                   4    8241K          4
2021-08-17T14:40:50.703555+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: KTR                        2    7168K          2
2021-08-17T14:40:50.703574+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ptr_llcb_map           56126    7017K  116151979
2021-08-17T14:40:50.703592+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown bins account for 84039K
2021-08-17T14:40:50.703611+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 1219801K
2021-08-17T14:40:50.703630+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: UMA Zalloc Pigs:
2021-08-17T14:40:50.703648+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ZONE NAME       SIZE     LIMIT     COUNT   MEM USED
2021-08-17T14:40:50.703668+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: mbuf          000256, 06012268, 00017191, 00004297K
2021-08-17T14:40:50.703687+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: socket        000872, 00765000, 00002327, 00001981K
2021-08-17T14:40:50.703704+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcpcb         001080, 00765000, 00001652, 00001742K
2021-08-17T14:40:50.703722+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcp_inpcb     000488, 00765000, 00001665, 00000793K
2021-08-17T14:40:50.703740+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udp_inpcb     000488, 00765000, 00000270, 00000128K
2021-08-17T14:40:50.703758+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: unpcb         000192, 00765000, 00000391, 00000073K
2021-08-17T14:40:50.703776+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: hostcache     000096, 00015360, 00000191, 00000017K
2021-08-17T14:40:50.703794+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udpcb         000032, 00765000, 00000270, 00000008K
2021-08-17T14:40:50.703812+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: clpbuf        001016, 00015872, 00000006, 00000005K
2021-08-17T14:40:50.703832+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcptw         000096, 00027767, 00000013, 00000001K
2021-08-17T14:40:50.703853+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ripcb         000488, 00765000, 00000001, 00000000K
2021-08-17T14:40:50.703872+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown zones account for 0K
2021-08-17T14:40:50.703890+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 9051K

Cause

Eine neue OneFS-Funktion, die in OneFS 9.2 eingeführt wurde, fügt diese Meldungen hinzu. 
Diese neue Funktion protokolliert Informationen zur Speichernutzung jedes Mal, wenn eine Pageout-Funktion vom pagedaemon aufgerufen wird, wenn sie nicht in der Lage ist, den freien Speicher über free_target zu bringen.
Das Betriebssystem ruft die obige Funktion proaktiv auf, um Informationen für den Fall zu protokollieren, dass der Arbeitsspeicher weiter knapp wird und der Node nicht mehr reagiert oder einen Fehler verursacht.

Resolution

Wichtig:
Wenn der Node nur über 16 GB RAM verfügt, empfehlen Sie dem Nutzer, ein Upgrade auf 64 GB durchzuführen.

Wenn der Node über 24 GB RAM oder mehr verfügt, können diese Meldungen bedenkenlos ignoriert werden, wenn alle diese Bedingungen erfüllt sind:

  • /var/log/vmlog zeigt, dass der freie Speicher häufig nicht unter 50 % des Zielwerts gesunken ist.
  • Keine Nodes im Cluster führen einen Panic-Neustart mit BUF_TIMELOCK oder anderen OOM-bezogenen Timeout-Meldungen in der Panic-Zeichenfolge aus
  • Der freevnodes sysctl Zeigt aktiviert (Wert 1) für alle Nodes an:
# isi_for_array 'sysctl vfs.vnlru_reuse_freevnodes'

Hinweis:
Vergessen Sie nicht, Änderungen vorzunehmen sysctl vfs.vnlru_reuse_freevnodes Kehren Sie zum Standardwert (0 - Null) zurück, wenn alle folgenden Bedingungen erfüllt sind:
  • Der Node verfügt über mindestens 24 GB physischen Speicher
  • Der vnlru_reuse_freevnodes=1 Die Einstellung wurde ursprünglich hinzugefügt, um das Problem mit hohen Dinodes von 8 KB zu lösen
  • Die OneFS-Version wird auf eine der folgenden Stufen oder höher aktualisiert:
    • OneFS 9.2.1.25_GA-RUP_2023-12
    • OneFS 9.4.0.17_GA RUP_2024-02
    • OneFS 9.5.0.7_LTS2023_GA-RUP (Januar 2024)
Article Properties
Article Number: 000191515
Article Type: Solution
Last Modified: 03 Apr 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.