Event: 노드가 패닉 상태에서 복구되었습니다. 패닉에 대한 정보가 파일에 기록됨: var tmp panic

Summary: 이 문서에서는 사용자 및 기술 지원에서 "노드가 패닉에서 복구되었습니다." 이벤트 또는 메시지를 관리하는 방법에 대해 설명합니다. 조치를 취하기 전에 문서의 모든 부분을 검토하십시오.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

이벤트
: 하나 이상의 노드가 패닉에서 복구되었음을 나타내는 이벤트 알림을 받았습니다. 패닉에 대한 정보는 다음 위치에 있는 파일에 기록됩니다. /var/tmp/ 영향을 받는 노드에서.
본보기:
4.3394   03/12 18:02 W    4    53125     Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175

Cause

노드 패닉의 정확한 원인은 다양할 수 있지만 일반적인 원인은 다음과 같습니다.
  • 하드웨어 오류
  • 소프트웨어 코드 오류
  • 잘못된 구성
패닉의 정확한 원인을 확인하려면 PowerScale 지원을 사용하여 클러스터 로그를 분석해야 합니다.

Resolution

문제 해결을 시작하려면 먼저 노드가 패닉 이벤트에서 복구되었고 다운되거나 오프라인 상태가 아닌지 확인합니다. *

문제를 해결하려면 노드에 대한 SSH 연결을 열고 "root" 계정을 사용하여 로그인합니다.
다음 명령을 실행하여 노드가 클러스터에 다시 연결되었는지 확인합니다.
# isi status
isi status 명령은 다음과 유사한 출력을 반환합니다. 노드가 클러스터에 성공적으로 다시 연결되면 Health 열에 "D"(다운)가 표시되지 않습니다.
                   Health  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.16.141.226  | OK  | 553M| 3.2M| 557M|61.9T/ 106T( 59%)|        L3:  1.5T
  2|10.16.141.227  | OK  | 481M| 96.0| 481M|62.2T/ 106T( 59%)|        L3:  1.5T
  3|10.16.141.228  | OK  | 372k| 332k| 704k|62.3T/ 106T( 59%)|        L3:  1.5T
  4|10.16.141.229  | OK  |10.8M| 941k|11.7M|62.6T/ 106T( 59%)|        L3:  1.5T
  5|10.16.141.230  | OK  | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)|        L3:  1.5T
  6|10.16.141.231  | OK  | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)|        L3:  1.5T
---+---------------+-----+-----+-----+-----+-----------------+-----------------
Cluster Totals:          | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)|        L3:  8.7T

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
다음 명령을 실행하여 로그를 수집하고 패닉 분석을 위해 Isilon 기술 지원 부서에 로그 세트를 제공합니다.
# isi_gather_info -f /var/tmp/
 
참고: /var/tmp/ 패닉 데이터는 기본 로그 수집에 수집되지 않습니다. 다음을 사용해야 합니다. isi_gather_info -f /var/tmp/ 적절한 패닉 정보를 수집합니다.

로그가 수신되면 기술 지원 부서에서 패닉 스택 세부 정보를 검토하고 분석합니다. 패닉 스택이 알려진 문제 또는 기술 자료 문서에 해당하는지 확인합니다. 패닉 스택 세부 정보가 알려진 문제 또는 기존 KB 문서와 일치하지 않는 경우 추가 평가를 위해 문제가 에스컬레이션됩니다. 기술 지원 부서는 하드웨어 교체, 코드 수정, 펌웨어 업데이트 또는 기타 완화와 같은 필요한 조치를 결정합니다.

* 노드가 여전히 다운된 경우 노드를 다시 온라인으로 전환하려면 추가 문제 해결을 수행해야 합니다. 지원이 필요한 경우 Isilon 기술 지원 부서에 문의하십시오.

자세한 내용은 문서 55936: Isilon OneFS: 이벤트 알림: Node Offline - Event ID: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007

Additional Information

참고:
  • 이 새로운 이벤트 알림은 OneFS v8.1.2.0, v8.2.2.0 및 v9.1.0.5의 2021년 3월 롤업 패치의 일부로 활성화됩니다. 2021년 3월 RUP(Roll Up Patch) 이전의 OneFS 버전을 실행하는 클러스터는 이 이벤트 알림을 게시하지 않습니다.
  • OneFS 9.2, 9.3, 9.4 이상에는 모두 이 기능이 포함되어 있습니다.
  • OneFS가 노드 패닉으로 인해 재부팅을 탐지하면 업데이트가 이벤트를 트리거합니다.
  • 이 이벤트에는 문제를 이해하고 해결하는 데 도움이 되는 코어 덤프 헤더와 같은 기본 정보가 포함될 수 있습니다.
  • 결과 Dial-Home SR은 심사 및 분석을 위해 추가 정보를 읽을 수 있는 형식으로 포함할 수 있습니다.

참고: 이 기능은 2021년 3월 RUP 설치 전에 클러스터에 있을 수 있는 이전 패닉 이벤트, 코어 또는 미니덤프로 인해 잘못된 경보를 유발할 수 있습니다. OneFS는 제거될 때까지 오래된 패닉 파일에 대한 알림을 계속 표시할 수 있습니다. 잘못된 경보를 방지하려면 다음 단계를 수행합니다.
  1. 로그를 강제로 회전하여 메시지 로그를 정리합니다. 이 기능은 messages.0.gz, messages.1.gz 등과 같은 gz 아카이브 내의 순환된 로그에서 패닉 정보를 확인하지 않습니다. 다음 명령을 실행하여 패닉이 발견될 때마다 /var/log/messages를 교체합니다.
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
  1. 각 노드 풀을 /var/crash 코어 또는 미니덤프 파일에 대한 각 노드의 디렉터리입니다. 승인을 받은 후 제거하거나 백업합니다.
  2. 다음 명령을 실행하여 정리합니다. vmcore 다음 위치에 있는 파일 /var/crash 모든 노드에서.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'

Affected Products

PowerScale OneFS

Products

Isilon
Article Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.