Hændelse: Noden er kommet sig efter panik. Oplysninger om panik registreres i fil: VAR TMP-panik

Summary: Denne artikel forklarer, hvordan brugere og teknisk support skal administrere hændelsen eller meddelelserne "Node er gendannet efter panik". Gennemgå alle dele af artiklen, før du handler. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

HÆNDELSE
Du har modtaget en hændelsesmeddelelse, der angiver, at en eller flere noder er gendannet efter panik. Oplysninger om panikken registreres i en fil, der findes under /var/tmp/ på de berørte noder.
Eksempel:
4.3394   03/12 18:02 W    4    53125     Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175

Cause

De nøjagtige årsager til en nodepanik kan variere, men typiske årsager kan omfatte:
  • Hardwarefejl
  • Softwarekodefejl
  • Fejlkonfiguration
Analyse af klyngelogfilerne skal udføres med PowerScale-understøttelse for den nøjagtige årsag til panikken.

Resolution

For at starte fejlfinding af problemet skal du først bekræfte, at noden er gendannet efter panikhændelsen og ikke er nede eller offline.

*For at fejlfinde skal du åbne en SSH-forbindelse til noden og logge ind ved hjælp af "root" -kontoen.
Kør følgende kommando for at bekræfte, at noden tilsluttes klyngen igen:
# isi status
Ikonet isi status kommando returnerer output svarende til følgende. Hvis noden sluttes til klyngen igen, vises "D" (ned) ikke i kolonnen Sundhed:
                   Health  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.16.141.226  | OK  | 553M| 3.2M| 557M|61.9T/ 106T( 59%)|        L3:  1.5T
  2|10.16.141.227  | OK  | 481M| 96.0| 481M|62.2T/ 106T( 59%)|        L3:  1.5T
  3|10.16.141.228  | OK  | 372k| 332k| 704k|62.3T/ 106T( 59%)|        L3:  1.5T
  4|10.16.141.229  | OK  |10.8M| 941k|11.7M|62.6T/ 106T( 59%)|        L3:  1.5T
  5|10.16.141.230  | OK  | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)|        L3:  1.5T
  6|10.16.141.231  | OK  | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)|        L3:  1.5T
---+---------------+-----+-----+-----+-----+-----------------+-----------------
Cluster Totals:          | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)|        L3:  8.7T

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
Indsaml logfiler ved at køre følgende kommando, og giv logfilen til Isilons tekniske support til analyse af panikken:
# isi_gather_info -f /var/tmp/
 
Bemærk: /var/tmp/ Panikdata indsamles ikke i en standardlogindsamling, du skal bruge isi_gather_info -f /var/tmp/ at indsamle korrekte panikoplysninger.

Når logfilerne er modtaget, skal teknisk support gennemgå og analysere oplysningerne om panikstakken. De bestemmer, om panikstakken svarer til et kendt problem eller en Knowledge Base-artikel. Hvis oplysningerne om Panic Stack ikke stemmer overens med et kendt problem eller en eksisterende KB-artikel, eskaleres problemet med henblik på yderligere vurdering. Teknisk support bestemmer, hvilke handlinger der er nødvendige, f.eks. udskiftning af hardware, koderettelse, firmwareopdatering eller andre afhjælpninger.

* Hvis noden stadig er nede, skal der udføres yderligere fejlfinding for at få noden online igen. Kontakt Isilons tekniske support, hvis der er behov for hjælp.

Du kan finde flere oplysninger i artikel 55936: Isilon OneFS: Hændelsesmeddelelse: Node Offline – Hændelses-id: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007

Additional Information

Bemærk:
  • Denne nye hændelsesmeddelelse er aktiveret som en del af opdateringsprogramrettelserne fra marts 2021 til OneFS v8.1.2.0, v8.2.2.0 og v9.1.0.5. Klynger, der kører OneFS-versioner før Roll Up Patch (RUP) i marts 2021, offentliggør ikke denne hændelsesmeddelelse.
  • OneFS 9.2, 9.3, 9.4 og derover har alle denne funktion inkluderet.
  • Opdateringen udløser en hændelse, hvis OneFS registrerer en genstart på grund af en nodepanik.
  • Hændelsen kan indeholde grundlæggende oplysninger som f.eks. centrale dumpoverskrifter for at hjælpe med at forstå og fejlfinde problemet.
  • En resulterende opkalds-hjem SR kan indeholde de yderligere oplysninger i et læsbart format til prioritering og analyse.

Bemærk: Denne funktion kan forårsage falske alarmer på grund af tidligere panikhændelser, kerner eller minidumps, der kan være på klyngen før installationen af marts 2021-rup. OneFS kan fortsætte med at advare om gamle panikfiler, indtil de fjernes. Udfør følgende trin for at undgå falske alarmer.
  1. Ryd op i meddelelsesloggen ved at tvinge dem til at rotere logfilerne. Denne funktion kontrollerer ikke, om der er panikoplysninger i roterede logfiler i et gz-arkiv, f.eks. messages.0.gz, messages.1.gz osv. Kør følgende kommando for at rotere /var/log/messages, når der findes panik:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
  1. Tjek /var/crash mappe for hver node for enhver kerne- eller minidumps-fil. Fjern dem eller sikkerhedskopier dem , når du har fået godkendelse.
  2. Kør følgende kommando for at rydde op vmcore Filer placeret i /var/crash på alle noder.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'

Affected Products

PowerScale OneFS

Products

Isilon
Article Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.