Isilon : Les messages /var/log sur certains nœuds affichent de temps en temps des messages de mémoire insuffisante

Summary: Les messages /var/log sur certains nœuds affichent de temps à autre ces messages de mémoire insuffisante (OOM) : Durée de vie : v_wire_count : 2832982, v_active_count : 516

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

 Voici un ensemble complet de messages : 
2021-08-17T14:40:50.703082+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: OOM: v_wire_count: 2843879, v_active_count: 871
2021-08-17T14:40:50.703246+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Malloc Pigs:
2021-08-17T14:40:50.703277+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Type                   InUse   MemUse   Requests
2021-08-17T14:40:50.703303+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: 8kB dinodes           840507  647775K 13330759531
2021-08-17T14:40:50.703325+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: isi_hash               31424   88002K 1548035744
2021-08-17T14:40:50.703344+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: lbm super              17535   84150K    1435677
2021-08-17T14:40:50.703362+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: layout_hints          183473   57336K   22320273
2021-08-17T14:40:50.703379+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: iaddr_set             886694   55419K 5188138062
2021-08-17T14:40:50.703397+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: devbuf                 17379   37840K     184744
2021-08-17T14:40:50.703414+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: newblk                    26   32774K    2364548
2021-08-17T14:40:50.703432+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: bar_owner_vec259         261   32288K    2220148
2021-08-17T14:40:50.703451+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: parent_vec153         218013   27538K    4567646
2021-08-17T14:40:50.703475+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ddvec84               183471   22840K  177809736
2021-08-17T14:40:50.703496+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: inodedep                  22   16390K    1677902
2021-08-17T14:40:50.703515+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: sysctloid             201426   10989K     201598
2021-08-17T14:40:50.703535+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: vfscache                   4    8241K          4
2021-08-17T14:40:50.703555+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: KTR                        2    7168K          2
2021-08-17T14:40:50.703574+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ptr_llcb_map           56126    7017K  116151979
2021-08-17T14:40:50.703592+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown bins account for 84039K
2021-08-17T14:40:50.703611+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 1219801K
2021-08-17T14:40:50.703630+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: UMA Zalloc Pigs:
2021-08-17T14:40:50.703648+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ZONE NAME       SIZE     LIMIT     COUNT   MEM USED
2021-08-17T14:40:50.703668+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: mbuf          000256, 06012268, 00017191, 00004297K
2021-08-17T14:40:50.703687+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: socket        000872, 00765000, 00002327, 00001981K
2021-08-17T14:40:50.703704+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcpcb         001080, 00765000, 00001652, 00001742K
2021-08-17T14:40:50.703722+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcp_inpcb     000488, 00765000, 00001665, 00000793K
2021-08-17T14:40:50.703740+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udp_inpcb     000488, 00765000, 00000270, 00000128K
2021-08-17T14:40:50.703758+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: unpcb         000192, 00765000, 00000391, 00000073K
2021-08-17T14:40:50.703776+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: hostcache     000096, 00015360, 00000191, 00000017K
2021-08-17T14:40:50.703794+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udpcb         000032, 00765000, 00000270, 00000008K
2021-08-17T14:40:50.703812+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: clpbuf        001016, 00015872, 00000006, 00000005K
2021-08-17T14:40:50.703832+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcptw         000096, 00027767, 00000013, 00000001K
2021-08-17T14:40:50.703853+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ripcb         000488, 00765000, 00000001, 00000000K
2021-08-17T14:40:50.703872+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown zones account for 0K
2021-08-17T14:40:50.703890+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 9051K

Cause

Une nouvelle fonction OneFS introduite dans OneFS 9.2 ajoute ces messages. 
Cette nouvelle fonction enregistre les informations d’utilisation de la mémoire chaque fois qu’une fonction pageout est appelée par pagedaemon lorsqu’elle n’est pas en mesure d’amener la mémoire libre au-dessus de free_target.
Le système d’exploitation appelle proactivement la fonction ci-dessus pour consigner les informations au cas où la mémoire serait trop faible et que le nœud cesserait de répondre ou de paniquer.

Resolution

Important:
Si le nœud ne dispose que de 16 Go de RAM, conseillez à l’utilisateur de passer à 64 Go.

Si le nœud dispose de 24 Go de RAM ou plus, ces messages peuvent être ignorés en toute sécurité si toutes ces conditions sont remplies :

  • Le fichier /var/log/vmlog indique que la mémoire libre n’est pas souvent descendue en dessous de l’objectif cible de 50 %
  • Aucun nœud dans le cluster, redémarrage inattendu avec BUF_TIMELOCK ou d’autres messages de délai d’expiration liés à l’OOM dans la chaîne de panique
  • Le freevnodes sysctl Affiche Activé (valeur 1) sur tous les nœuds :
# isi_for_array 'sysctl vfs.vnlru_reuse_freevnodes'

Note:
N’oubliez pas de changer sysctl vfs.vnlru_reuse_freevnodes Retour à la valeur par défaut (0 - zéro) si toutes les conditions suivantes sont remplies :
  • Le nœud dispose d’une mémoire physique de 24 Go ou plus
  • Le vnlru_reuse_freevnodes=1 Le paramètre a été ajouté à l’origine pour résoudre le problème des Dinodes de 8 Ko élevés
  • La version OneFS est mise à niveau vers l’un des niveaux suivants ou une version supérieure :
    • OneFS 9.2.1.25_GA-RUP_2023-12
    • OneFS 9.4.0.17_GA-RUP_2024-02
    • OneFS 9.5.0.7_LTS2023_GA-RUP (janvier 2024)
Article Properties
Article Number: 000191515
Article Type: Solution
Last Modified: 03 Apr 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.