Isilon: 일부 노드의 /var/log 메시지는 때때로 메모리 부족 메시지를 표시합니다
Summary: 일부 노드의 /var/log 메시지에는 다음과 같은 OOM(Out of Memory) 메시지가 수시로 표시됩니다. OOM: v_wire_count: 2832982, v_active_count: 516
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
전체 메시지 집합은 다음과 같습니다.
2021-08-17T14:40:50.703082+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: OOM: v_wire_count: 2843879, v_active_count: 871 2021-08-17T14:40:50.703246+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Malloc Pigs: 2021-08-17T14:40:50.703277+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Type InUse MemUse Requests 2021-08-17T14:40:50.703303+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: 8kB dinodes 840507 647775K 13330759531 2021-08-17T14:40:50.703325+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: isi_hash 31424 88002K 1548035744 2021-08-17T14:40:50.703344+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: lbm super 17535 84150K 1435677 2021-08-17T14:40:50.703362+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: layout_hints 183473 57336K 22320273 2021-08-17T14:40:50.703379+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: iaddr_set 886694 55419K 5188138062 2021-08-17T14:40:50.703397+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: devbuf 17379 37840K 184744 2021-08-17T14:40:50.703414+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: newblk 26 32774K 2364548 2021-08-17T14:40:50.703432+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: bar_owner_vec259 261 32288K 2220148 2021-08-17T14:40:50.703451+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: parent_vec153 218013 27538K 4567646 2021-08-17T14:40:50.703475+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ddvec84 183471 22840K 177809736 2021-08-17T14:40:50.703496+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: inodedep 22 16390K 1677902 2021-08-17T14:40:50.703515+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: sysctloid 201426 10989K 201598 2021-08-17T14:40:50.703535+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: vfscache 4 8241K 4 2021-08-17T14:40:50.703555+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: KTR 2 7168K 2 2021-08-17T14:40:50.703574+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ptr_llcb_map 56126 7017K 116151979 2021-08-17T14:40:50.703592+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown bins account for 84039K 2021-08-17T14:40:50.703611+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 1219801K 2021-08-17T14:40:50.703630+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: UMA Zalloc Pigs: 2021-08-17T14:40:50.703648+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ZONE NAME SIZE LIMIT COUNT MEM USED 2021-08-17T14:40:50.703668+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: mbuf 000256, 06012268, 00017191, 00004297K 2021-08-17T14:40:50.703687+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: socket 000872, 00765000, 00002327, 00001981K 2021-08-17T14:40:50.703704+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcpcb 001080, 00765000, 00001652, 00001742K 2021-08-17T14:40:50.703722+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcp_inpcb 000488, 00765000, 00001665, 00000793K 2021-08-17T14:40:50.703740+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udp_inpcb 000488, 00765000, 00000270, 00000128K 2021-08-17T14:40:50.703758+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: unpcb 000192, 00765000, 00000391, 00000073K 2021-08-17T14:40:50.703776+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: hostcache 000096, 00015360, 00000191, 00000017K 2021-08-17T14:40:50.703794+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: udpcb 000032, 00765000, 00000270, 00000008K 2021-08-17T14:40:50.703812+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: clpbuf 001016, 00015872, 00000006, 00000005K 2021-08-17T14:40:50.703832+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: tcptw 000096, 00027767, 00000013, 00000001K 2021-08-17T14:40:50.703853+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: ripcb 000488, 00765000, 00000001, 00000000K 2021-08-17T14:40:50.703872+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Unshown zones account for 0K 2021-08-17T14:40:50.703890+12:00 <0.4> cluster-1(id1) /boot/kernel.amd64/kernel: Total: 9051K
Cause
OneFS 9.2에 도입된 새로운 OneFS 함수에 이러한 메시지가 추가됩니다.
이 새 함수는 사용 가능한 메모리를 free_target 이상으로 가져올 수 없는 경우 pagedaemon에서 pageout 함수를 호출할 때마다 메모리 사용량 정보를 기록합니다.
운영 체제는 메모리가 더 부족해지고 노드가 응답을 중지하거나 패닉이 발생하는 경우 정보를 기록하기 위해 위의 함수를 사전 예방적으로 호출합니다.
이 새 함수는 사용 가능한 메모리를 free_target 이상으로 가져올 수 없는 경우 pagedaemon에서 pageout 함수를 호출할 때마다 메모리 사용량 정보를 기록합니다.
운영 체제는 메모리가 더 부족해지고 노드가 응답을 중지하거나 패닉이 발생하는 경우 정보를 기록하기 위해 위의 함수를 사전 예방적으로 호출합니다.
Resolution
중요:
노드에 16GB RAM만 있는 경우 사용자에게 64GB로 업그레이드하도록 조언합니다.
노드에 24GB RAM 이상이 있는 경우 다음 조건이 모두 충족되면 이러한 메시지를 무시해도 됩니다.
- /var/log/vmlog는 여유 메모리가 50% 여유 타겟 아래로 자주 내려가지 않았음을 보여줍니다
- 클러스터 패닉 재부팅의 노드가 없고 패닉 문자열에 BUF_TIMELOCK 또는 기타 OOM 관련 시간 초과 메시지가 표시됩니다.
- 비디오
freevnodes sysctl모든 노드에서 활성화(값 1)로 표시됩니다.
# isi_for_array 'sysctl vfs.vnlru_reuse_freevnodes'
참고:
변경되는 것을 잊지 마십시오.
sysctl vfs.vnlru_reuse_freevnodes 다음 조건이 모두 충족되면 기본값(0 - 영)으로 돌아갑니다.
- 노드의 물리적 메모리가 24GB 이상입니다.
- 비디오
vnlru_reuse_freevnodes=1설정은 원래 높은 8KB 다이노드 문제를 해결하기 위해 추가되었습니다. - OneFS 버전이 다음 수준 중 하나 이상으로 업그레이드됩니다.
- OneFS 9.2.1.25_GA-RUP_2023-12
- OneFS 9.4.0.17_GA-RUP_2024-02
- OneFS 9.5.0.7_LTS2023_GA-RUP(2024년 1월)
Article Properties
Article Number: 000191515
Article Type: Solution
Last Modified: 03 Apr 2024
Version: 5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.