PowerStore: Linux 드라이버 메모리 누수로 인해 노드가 예기치 않게 재부팅될 수 있음

요약: SCST(SCSI Target) 보고서 LUN 응답에 대한 커널 공간 내의 메모리 누수로 인해 노드가 예기치 않게 재설정될 수 있습니다.

이 문서는 다음에 적용됩니다. 이 문서는 다음에 적용되지 않습니다. 이 문서는 특정 제품과 관련이 없습니다. 모든 제품 버전이 이 문서에 나와 있는 것은 아닙니다.

증상

시스템에서 다음과 같은 과도한 메시지를 보고합니다.
svc_journalctl | grep "REPORT LUNS"

Apr x 01:00:31 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:31 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:33 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:34 xxxxx-B kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'
Apr x 01:00:34 xxxxx-A kernel: scst: REPORT LUNS got, target='xx:xx:xx:xx:xx:xx:xx:xx', initiator='xx:xx:xx:xx:xx:xx:xx:xx'

이러한 메시지의 수를 확인하는 유용한 명령은 다음과 같습니다.
svc_journalctl --since="today" | grep -c "REPORT LUNS"
44835

로그에 기아 상태 표시가 나타날 수 있습니다.
svc_journalctl--since="today" grep -i starved

Apr x 01:47:58.501672 xxxx-A xtremapp[22524]: Apr x 01:47:58.500331 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 550906 us (the threshold is 500000) #STARV
Apr x 03:14:00.770872 xxxx-A xtremapp[22524]: Apr x 03:14:00.745703 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 518854 us (the threshold is 500000) #STARV
Apr x 04:35:39.509945 xxxx-A xtremapp[22524]: Apr x 04:35:39.507440 M [log_id:22772][3840(3891 nb_truck_0_sym   0x7fa0ffc20d00)]sym_ham_nbt_timer:1284: ====+ HAM: SYM NBT was starved for 523371 us (the threshold is 500000) #STARV


일반적으로 이 이벤트에 대해 덤프 파일이 생성되지만 RCA(Root Cause Analysis)에는 필요하지 않습니다. svc_dc list_dumps를 참조하십시오.

원인

이 문제는 ESXi의 과도한 "Report LUN" 명령으로 SCST의 커널 공간 내 메모리 누수로 인해 발생합니다. 이로 인해 노드 재설정을 트리거하는 노드 간 keepalive 통신이 지연될 수 있습니다.

해결

이 문제는 PowerStoreOS 1.0.4.0.5.006(V1 SP4.1)에서 해결되었습니다.

수정 사항은 MDT-261192의 릴리스 노트에 나와 있습니다. Linux 드라이버 메모리 누수로 인해 노드가 예기치 않게 재부팅될 수 있습니다.

해당 제품

PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000T

제품

PowerStore 9000X
문서 속성
문서 번호: 000185532
문서 유형: Solution
마지막 수정 시간: 04 11월 2021
버전:  5
다른 Dell 사용자에게 질문에 대한 답변 찾기
지원 서비스
디바이스에 지원 서비스가 적용되는지 확인하십시오.