Hændelse: Noden er kommet sig efter panik. Oplysninger om panik registreres i fil: VAR TMP-panik
Summary: Denne artikel forklarer, hvordan brugere og teknisk support skal administrere hændelsen eller meddelelserne "Node er gendannet efter panik". Gennemgå alle dele af artiklen, før du handler. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
HÆNDELSE
Du har modtaget en hændelsesmeddelelse, der angiver, at en eller flere noder er gendannet efter panik. Oplysninger om panikken registreres i en fil, der findes under
Eksempel:
Du har modtaget en hændelsesmeddelelse, der angiver, at en eller flere noder er gendannet efter panik. Oplysninger om panikken registreres i en fil, der findes under
/var/tmp/ på de berørte noder.
Eksempel:
4.3394 03/12 18:02 W 4 53125 Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175
Cause
De nøjagtige årsager til en nodepanik kan variere, men typiske årsager kan omfatte:
- Hardwarefejl
- Softwarekodefejl
- Fejlkonfiguration
Resolution
For at starte fejlfinding af problemet skal du først bekræfte, at noden er gendannet efter panikhændelsen og ikke er nede eller offline.
*For at fejlfinde skal du åbne en SSH-forbindelse til noden og logge ind ved hjælp af "root" -kontoen.
Kør følgende kommando for at bekræfte, at noden tilsluttes klyngen igen:
Når logfilerne er modtaget, skal teknisk support gennemgå og analysere oplysningerne om panikstakken. De bestemmer, om panikstakken svarer til et kendt problem eller en Knowledge Base-artikel. Hvis oplysningerne om Panic Stack ikke stemmer overens med et kendt problem eller en eksisterende KB-artikel, eskaleres problemet med henblik på yderligere vurdering. Teknisk support bestemmer, hvilke handlinger der er nødvendige, f.eks. udskiftning af hardware, koderettelse, firmwareopdatering eller andre afhjælpninger.
* Hvis noden stadig er nede, skal der udføres yderligere fejlfinding for at få noden online igen. Kontakt Isilons tekniske support, hvis der er behov for hjælp.
Du kan finde flere oplysninger i artikel 55936: Isilon OneFS: Hændelsesmeddelelse: Node Offline – Hændelses-id: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007
*For at fejlfinde skal du åbne en SSH-forbindelse til noden og logge ind ved hjælp af "root" -kontoen.
Kør følgende kommando for at bekræfte, at noden tilsluttes klyngen igen:
# isi statusIkonet
isi status kommando returnerer output svarende til følgende. Hvis noden sluttes til klyngen igen, vises "D" (ned) ikke i kolonnen Sundhed:
Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size ---+---------------+-----+-----+-----+-----+-----------------+----------------- 1|10.16.141.226 | OK | 553M| 3.2M| 557M|61.9T/ 106T( 59%)| L3: 1.5T 2|10.16.141.227 | OK | 481M| 96.0| 481M|62.2T/ 106T( 59%)| L3: 1.5T 3|10.16.141.228 | OK | 372k| 332k| 704k|62.3T/ 106T( 59%)| L3: 1.5T 4|10.16.141.229 | OK |10.8M| 941k|11.7M|62.6T/ 106T( 59%)| L3: 1.5T 5|10.16.141.230 | OK | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)| L3: 1.5T 6|10.16.141.231 | OK | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)| L3: 1.5T ---+---------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)| L3: 8.7T Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-OnlyIndsaml logfiler ved at køre følgende kommando, og giv logfilen til Isilons tekniske support til analyse af panikken:
# isi_gather_info -f /var/tmp/
Bemærk:
/var/tmp/ Panikdata indsamles ikke i en standardlogindsamling, du skal bruge isi_gather_info -f /var/tmp/ at indsamle korrekte panikoplysninger.
Når logfilerne er modtaget, skal teknisk support gennemgå og analysere oplysningerne om panikstakken. De bestemmer, om panikstakken svarer til et kendt problem eller en Knowledge Base-artikel. Hvis oplysningerne om Panic Stack ikke stemmer overens med et kendt problem eller en eksisterende KB-artikel, eskaleres problemet med henblik på yderligere vurdering. Teknisk support bestemmer, hvilke handlinger der er nødvendige, f.eks. udskiftning af hardware, koderettelse, firmwareopdatering eller andre afhjælpninger.
* Hvis noden stadig er nede, skal der udføres yderligere fejlfinding for at få noden online igen. Kontakt Isilons tekniske support, hvis der er behov for hjælp.
Du kan finde flere oplysninger i artikel 55936: Isilon OneFS: Hændelsesmeddelelse: Node Offline – Hændelses-id: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007
Additional Information
Bemærk:
- Denne nye hændelsesmeddelelse er aktiveret som en del af opdateringsprogramrettelserne fra marts 2021 til OneFS v8.1.2.0, v8.2.2.0 og v9.1.0.5. Klynger, der kører OneFS-versioner før Roll Up Patch (RUP) i marts 2021, offentliggør ikke denne hændelsesmeddelelse.
- OneFS 9.2, 9.3, 9.4 og derover har alle denne funktion inkluderet.
- Opdateringen udløser en hændelse, hvis OneFS registrerer en genstart på grund af en nodepanik.
- Hændelsen kan indeholde grundlæggende oplysninger som f.eks. centrale dumpoverskrifter for at hjælpe med at forstå og fejlfinde problemet.
- En resulterende opkalds-hjem SR kan indeholde de yderligere oplysninger i et læsbart format til prioritering og analyse.
Bemærk: Denne funktion kan forårsage falske alarmer på grund af tidligere panikhændelser, kerner eller minidumps, der kan være på klyngen før installationen af marts 2021-rup. OneFS kan fortsætte med at advare om gamle panikfiler, indtil de fjernes. Udfør følgende trin for at undgå falske alarmer.
- Ryd op i meddelelsesloggen ved at tvinge dem til at rotere logfilerne. Denne funktion kontrollerer ikke, om der er panikoplysninger i roterede logfiler i et gz-arkiv, f.eks. messages.0.gz, messages.1.gz osv. Kør følgende kommando for at rotere /var/log/messages, når der findes panik:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
- Tjek
/var/crashmappe for hver node for enhver kerne- eller minidumps-fil. Fjern dem eller sikkerhedskopier dem , når du har fået godkendelse. - Kør følgende kommando for at rydde op
vmcoreFiler placeret i/var/crashpå alle noder.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'
Affected Products
PowerScale OneFSProducts
IsilonArticle Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version: 15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.