PowerStore: Uventet omstart av node eller kjernekrise
Summary: For å identifisere årsaken til en omstart eller gi en fullstendig rotårsaksanalyse (RCA) er det nødvendig med ulike logger.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Den mest sannsynlige hendelses- eller feilkoden for dette problemet er:
0x00304404 Beskrivelse: Noden er fysisk fjernet eller slått av.
Andre mulige hendelseskoder:
Omstart av en node kan utløse andre sekundære varsler eller ringe hjem, for eksempel:
0x00304404 Beskrivelse: Noden er fysisk fjernet eller slått av.
Andre mulige hendelseskoder:
- 0x00307701: XENV er ikke aktiv.
- 0x00304203: Node has stopped (Noden har stoppet).
- 0x00302b04: Noden er stoppet.
- 0x00300D06: Klyngetjenesten er stoppet.
- 0x0030c601: Verktøyet har sluttet å vedlikeholde IO-er.
Omstart av en node kan utløse andre sekundære varsler eller ringe hjem, for eksempel:
- Varsler om portkoblingsfeil ( hendelseskode 0x00307404). Mer informasjon i PowerStore-varsler: Portkoblingsfeil.
- Varsler om porttilstand (hendelseskoder: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Mer informasjon i PowerStore-varsler: Tilstandstilstander for nodeport
Cause
En PowerStore-node kan starte uventet på nytt av ulike årsaker.
Hver uventede omstart bør undersøkes separat.
Se delen tilleggsinformasjon nedenfor hvis du vil ha mer informasjon om hva som trengs for denne undersøkelsen.
Hver uventede omstart bør undersøkes separat.
Se delen tilleggsinformasjon nedenfor hvis du vil ha mer informasjon om hva som trengs for denne undersøkelsen.
Resolution
Det finnes noen alternativer for å se etter uventede omstarter av noden.
Logg på klyngen over ssh og kjør svc_dc list_dumps
Du kan også prøve å finne dumpfiler fra PowerStore Manager. Hvis du vil ha mer informasjon, kan du se PowerStore: Slik genererer og samler du inn ulike logger fra PowerStore.
Hvis du vil logge på nodene over ssh, kan du finne IP-adressen for klyngen eller noden i PowerStore Manager under Settings > Network IPs (Innstillinger > nettverks-IP-er). Logg på med din foretrukne ssh-klient ved hjelp av servicebrukerkontoen og det respektive servicebrukerpassordet (definert under oppsettet av systemet).
Dette er også nyttig ettersom enkelte uventede omstarter kanskje ikke produserer en dumpfil.
Kontrollere varsler og hendelser fra PowerStore Manager (GUI)
Kontroller hendelser og varsler som kan indikere en uventet omstart av en node:- I PowerStore Manager kontrollerer du overvåkingsdelen og ser på detaljene under fanene VARSLER og HENDELSER .
- Se etter tidsstempler, feil- eller hendelseskoder, meldinger osv. Hvis du vil gjøre søket tydeligere, kan du bruke filteralternativene i fanene ALERTS (VARSLER og HENDELSEr):
Søke etter dumpfiler
Kontroller om det finnes systemdumpfiler på feiltidspunktet. Kjernedumper er ikke inkludert i datainnsamlinger.Logg på klyngen over ssh og kjør svc_dc list_dumps
Du kan også prøve å finne dumpfiler fra PowerStore Manager. Hvis du vil ha mer informasjon, kan du se PowerStore: Slik genererer og samler du inn ulike logger fra PowerStore.
Hvis du vil logge på nodene over ssh, kan du finne IP-adressen for klyngen eller noden i PowerStore Manager under Settings > Network IPs (Innstillinger > nettverks-IP-er). Logg på med din foretrukne ssh-klient ved hjelp av servicebrukerkontoen og det respektive servicebrukerpassordet (definert under oppsettet av systemet).
Kontrollere oppetiden på begge nodene
Kjør kommandoens oppetid på begge nodene. Dette vil fortelle deg hvor lenge noden hadde vært oppe og bidra til å bekrefte mulige omstarter.Dette er også nyttig ettersom enkelte uventede omstarter kanskje ikke produserer en dumpfil.
Andre indikatorer
Et mellomrom i ytelsesgrafene i PowerStore Manager kan også indikere omstart av en node. Dette bør bare brukes til veiledning, og du må bekrefte med flere bevis som foreslått ovenfor. Ytelsesgrafer er tilgjengelige enten fra instrumentbord > YTELSE eller maskinvare > Appliance X > Performance.Additional Information
Hva er nødvendig for RCA (Root Cause Analysis)?
- Støttemateriell fra alle apparatene i klyngen. Disse skal samles inn så nær omstarten som mulig.
- Dumpfilen
Affected Products
PowerStoreArticle Properties
Article Number: 000130141
Article Type: Solution
Last Modified: 16 Aug 2023
Version: 14
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.