Hændelse: Noden er kommet sig efter panik. Oplysninger om panik registreres i fil: VAR TMP-panik

Oversigt: Denne artikel forklarer, hvordan brugere og teknisk support skal administrere hændelsen eller meddelelserne "Node er gendannet efter panik". Gennemgå alle dele af artiklen, før du handler. ...

Denne artikel gælder for Denne artikel gælder ikke for Denne artikel er ikke knyttet til et bestemt produkt. Det er ikke alle produktversioner, der er identificeret i denne artikel.

Symptomer

HÆNDELSE
Du har modtaget en hændelsesmeddelelse, der angiver, at en eller flere noder er gendannet efter panik. Oplysninger om panikken registreres i en fil, der findes under /var/tmp/ på de berørte noder.
Eksempel:
4.3394   03/12 18:02 W    4    53125     Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175

Årsag

De nøjagtige årsager til en nodepanik kan variere, men typiske årsager kan omfatte:
  • Hardwarefejl
  • Softwarekodefejl
  • Fejlkonfiguration
Analyse af klyngelogfilerne skal udføres med PowerScale-understøttelse for den nøjagtige årsag til panikken.

Løsning

For at starte fejlfinding af problemet skal du først bekræfte, at noden er gendannet efter panikhændelsen og ikke er nede eller offline.

*For at fejlfinde skal du åbne en SSH-forbindelse til noden og logge ind ved hjælp af "root" -kontoen.
Kør følgende kommando for at bekræfte, at noden tilsluttes klyngen igen:
# isi status
Ikonet isi status kommando returnerer output svarende til følgende. Hvis noden sluttes til klyngen igen, vises "D" (ned) ikke i kolonnen Sundhed:
                   Health  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.16.141.226  | OK  | 553M| 3.2M| 557M|61.9T/ 106T( 59%)|        L3:  1.5T
  2|10.16.141.227  | OK  | 481M| 96.0| 481M|62.2T/ 106T( 59%)|        L3:  1.5T
  3|10.16.141.228  | OK  | 372k| 332k| 704k|62.3T/ 106T( 59%)|        L3:  1.5T
  4|10.16.141.229  | OK  |10.8M| 941k|11.7M|62.6T/ 106T( 59%)|        L3:  1.5T
  5|10.16.141.230  | OK  | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)|        L3:  1.5T
  6|10.16.141.231  | OK  | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)|        L3:  1.5T
---+---------------+-----+-----+-----+-----+-----------------+-----------------
Cluster Totals:          | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)|        L3:  8.7T

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
Indsaml logfiler ved at køre følgende kommando, og giv logfilen til Isilons tekniske support til analyse af panikken:
# isi_gather_info -f /var/tmp/
 
Bemærk: /var/tmp/ Panikdata indsamles ikke i en standardlogindsamling, du skal bruge isi_gather_info -f /var/tmp/ at indsamle korrekte panikoplysninger.

Når logfilerne er modtaget, skal teknisk support gennemgå og analysere oplysningerne om panikstakken. De bestemmer, om panikstakken svarer til et kendt problem eller en Knowledge Base-artikel. Hvis oplysningerne om Panic Stack ikke stemmer overens med et kendt problem eller en eksisterende KB-artikel, eskaleres problemet med henblik på yderligere vurdering. Teknisk support bestemmer, hvilke handlinger der er nødvendige, f.eks. udskiftning af hardware, koderettelse, firmwareopdatering eller andre afhjælpninger.

* Hvis noden stadig er nede, skal der udføres yderligere fejlfinding for at få noden online igen. Kontakt Isilons tekniske support, hvis der er behov for hjælp.

Du kan finde flere oplysninger i artikel 55936: Isilon OneFS: Hændelsesmeddelelse: Node Offline – Hændelses-id: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007

Flere oplysninger

Bemærk:
  • Denne nye hændelsesmeddelelse er aktiveret som en del af opdateringsprogramrettelserne fra marts 2021 til OneFS v8.1.2.0, v8.2.2.0 og v9.1.0.5. Klynger, der kører OneFS-versioner før Roll Up Patch (RUP) i marts 2021, offentliggør ikke denne hændelsesmeddelelse.
  • OneFS 9.2, 9.3, 9.4 og derover har alle denne funktion inkluderet.
  • Opdateringen udløser en hændelse, hvis OneFS registrerer en genstart på grund af en nodepanik.
  • Hændelsen kan indeholde grundlæggende oplysninger som f.eks. centrale dumpoverskrifter for at hjælpe med at forstå og fejlfinde problemet.
  • En resulterende opkalds-hjem SR kan indeholde de yderligere oplysninger i et læsbart format til prioritering og analyse.

Bemærk: Denne funktion kan forårsage falske alarmer på grund af tidligere panikhændelser, kerner eller minidumps, der kan være på klyngen før installationen af marts 2021-rup. OneFS kan fortsætte med at advare om gamle panikfiler, indtil de fjernes. Udfør følgende trin for at undgå falske alarmer.
  1. Ryd op i meddelelsesloggen ved at tvinge dem til at rotere logfilerne. Denne funktion kontrollerer ikke, om der er panikoplysninger i roterede logfiler i et gz-arkiv, f.eks. messages.0.gz, messages.1.gz osv. Kør følgende kommando for at rotere /var/log/messages, når der findes panik:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
  1. Tjek /var/crash mappe for hver node for enhver kerne- eller minidumps-fil. Fjern dem eller sikkerhedskopier dem , når du har fået godkendelse.
  2. Kør følgende kommando for at rydde op vmcore Filer placeret i /var/crash på alle noder.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'

Berørte produkter

PowerScale OneFS

Produkter

Isilon
Artikelegenskaber
Artikelnummer: 000184828
Artikeltype: Solution
Senest ændret: 18 sep. 2025
Version:  15
Find svar på dine spørgsmål fra andre Dell-brugere
Supportservices
Kontrollér, om din enhed er dækket af supportservices.