Tapahtuma: Node on toipunut paniikista. Tieto paniikista on tallennettu tiedostoon: var tmp panic

Summary: Tässä artikkelissa kerrotaan, miten käyttäjien ja teknisen tuen tulisi hallita solmu on palautunut paniikista -tapahtumaa tai -ilmoituksia. Tarkista kaikki artikkelin osat ennen kuin toimit. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

TAPAHTUMA
Olet saanut tapahtumailmoituksen, jonka mukaan vähintään yksi solmu on toipunut paniikista. Ytimen kaatumistiedot on tallennettu tiedostoon, joka sijaitsee kohdassa /var/tmp/ solmuissa, joita asia koskee.
Esimerkki:
4.3394   03/12 18:02 W    4    53125     Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175

Cause

Solmun ytimen kaatumisen tarkka syy voi vaihdella, mutta yleisiä syitä ovat esimerkiksi seuraavat:
  • Laitevika
  • Ohjelmistokoodin virhe
  • Määritysvirhe
Ytimen kaatumisen tarkka syy on analysoitava PowerScale-tuen kanssa.

Resolution

Aloita ongelman vianmääritys varmistamalla, että solmu on toipunut paniikkitapahtumasta eikä ole poissa käytöstä tai offline-tilassa.

*Avaa vianmääritystä varten SSH-yhteys solmuun ja kirjaudu root-tilillä.
Varmista seuraavalla komennolla, että solmu on liittynyt klusteriin uudelleen:
# isi status
pikanäppäimellä isi status Komento palauttaa seuraavan kaltaisen tuloksen. Jos solmu on liittynyt klusteriin onnistuneesti, Terveys-sarakkeessa ei näy "D" (alas):
                   Health  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.16.141.226  | OK  | 553M| 3.2M| 557M|61.9T/ 106T( 59%)|        L3:  1.5T
  2|10.16.141.227  | OK  | 481M| 96.0| 481M|62.2T/ 106T( 59%)|        L3:  1.5T
  3|10.16.141.228  | OK  | 372k| 332k| 704k|62.3T/ 106T( 59%)|        L3:  1.5T
  4|10.16.141.229  | OK  |10.8M| 941k|11.7M|62.6T/ 106T( 59%)|        L3:  1.5T
  5|10.16.141.230  | OK  | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)|        L3:  1.5T
  6|10.16.141.231  | OK  | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)|        L3:  1.5T
---+---------------+-----+-----+-----+-----+-----------------+-----------------
Cluster Totals:          | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)|        L3:  8.7T

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
Kerää lokit suorittamalla seuraava komento ja toimita lokijoukko Isilonin tekniseen tukeen Panic-kaatumisen analysointia varten:
# isi_gather_info -f /var/tmp/
 
Huomautus: /var/tmp/ Paniikkitietoja ei kerätä oletusarvoisessa lokikeräyksessä, vaan käytössä on isi_gather_info -f /var/tmp/ kerätä asianmukaisia paniikkitietoja.

Kun lokit on vastaanotettu, tekninen tuki tarkistaa ja analysoi Panic Stackin tiedot. Ne määrittävät, vastaako paniikkipino jotain tunnettua ongelmaa tai tietämyskannan artikkelia. Jos Panic Stackin tiedot eivät vastaa tunnettua ongelmaa tai aiempaa tietämyskannan artikkelia, ongelma eskaloidaan lisäarviointia varten. Tekninen tuki määrittää, mitä toimia tarvitaan, kuten laitteiston vaihto, koodikorjaus, laiteohjelmistopäivitys tai muu lieventävä toimenpide.

* Jos yhteys solmuun on edelleen katkennut, yhteyden palauttaminen solmuun edellyttää lisävianmääritystä. Jos tarvitset apua, ota yhteys Isilonin tekniseen tukeen.

Lisätietoja on artikkelissa 55936: Isilon OneFS: Tapahtumailmoitus: Node Offline - Event ID: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007

Additional Information

Huomautus:
  • Tämä uusi tapahtumailmoitus on otettu käyttöön osana OneFS-versioiden 8.1.2.0, 8.2.2.0 ja 9.1.0.5 maaliskuun 2021 roll-up-korjauksia. Klustereissa, joissa on käytössä maaliskuun 2021 RUP (Roll Up Patch) -korjausta edeltävä OneFS-versio, ei julkaista tätä tapahtumailmoitusta.
  • Tämä ominaisuus sisältyy OneFS 9.2-, 9.3-, 9.4- ja uudempiin versioihin.
  • Päivitys käynnistää tapahtuman, jos OneFS havaitsee solmun ytimen kaatumisesta johtuvan uudelleenkäynnistyksen.
  • Tapahtuma voi sisältää perustietoja, kuten Core-vedostiedoston otsikot, jotka auttavat hahmottamaan ongelmaa ja tekemään sen vianmäärityksen.
  • Tuloksena oleva dial-home SR voi sisältää lisätiedot luettavassa muodossa luokittelua ja analysointia varten.

Huomautus: Tämä toiminto voi aiheuttaa vääriä hälytyksiä aiempien ytimen kaatumistapahtumien taikka sellaisten Core- tai minivedostiedostojen vuoksi, joita voi olla klusterissa ennen maaliskuun 2021 RUP-korjausta. OneFS saattaa edelleen varoittaa vanhoista paniikkitiedostoista, kunnes se poistetaan. Estä väärät hälytykset tekemällä seuraavat toimet.
  1. Puhdista viestiloki pakollisella lokien kierrätyksellä. Tämä toiminto ei tarkista ytimen kaatumistietoja kierrätetyissä lokeissa, jotka sijaitsevat gz-arkistossa, kuten messages.0.gz, messages.1.gz ja niin edelleen. Kierrätä /var/log/messages suorittamalla seuraava komento aina, kun ytimen kaatumisia havaitaan:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
  1. Tarkista /var/crash kunkin solmun hakemisto mahdollisille Core- tai minivedostiedostoille. Poista tai varmuuskopioi ne hyväksynnän saamisen jälkeen.
  2. Puhdista seuraavalla komennolla vmcore Tiedostot, jotka sijaitsevat /var/crash kaikissa solmuissa.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'

Affected Products

PowerScale OneFS

Products

Isilon
Article Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.