PowerStore: Uventet omstart av node eller kjernekrise
Riepilogo: For å identifisere årsaken til en omstart eller gi en fullstendig rotårsaksanalyse (RCA) er det nødvendig med ulike logger.
Questo articolo si applica a
Questo articolo non si applica a
Questo articolo non è legato a un prodotto specifico.
Non tutte le versioni del prodotto sono identificate in questo articolo.
Sintomi
Den mest sannsynlige hendelses- eller feilkoden for dette problemet er:
0x00304404 Beskrivelse: Noden er fysisk fjernet eller slått av.
Andre mulige hendelseskoder:
Omstart av en node kan utløse andre sekundære varsler eller ringe hjem, for eksempel:
0x00304404 Beskrivelse: Noden er fysisk fjernet eller slått av.
Andre mulige hendelseskoder:
- 0x00307701: XENV er ikke aktiv.
- 0x00304203: Node has stopped (Noden har stoppet).
- 0x00302b04: Noden er stoppet.
- 0x00300D06: Klyngetjenesten er stoppet.
- 0x0030c601: Verktøyet har sluttet å vedlikeholde IO-er.
Omstart av en node kan utløse andre sekundære varsler eller ringe hjem, for eksempel:
- Varsler om portkoblingsfeil ( hendelseskode 0x00307404). Mer informasjon i PowerStore-varsler: Portkoblingsfeil.
- Varsler om porttilstand (hendelseskoder: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Mer informasjon i PowerStore-varsler: Tilstandstilstander for nodeport
Causa
En PowerStore-node kan starte uventet på nytt av ulike årsaker.
Hver uventede omstart bør undersøkes separat.
Se delen tilleggsinformasjon nedenfor hvis du vil ha mer informasjon om hva som trengs for denne undersøkelsen.
Hver uventede omstart bør undersøkes separat.
Se delen tilleggsinformasjon nedenfor hvis du vil ha mer informasjon om hva som trengs for denne undersøkelsen.
Risoluzione
Det finnes noen alternativer for å se etter uventede omstarter av noden.
Logg på klyngen over ssh og kjør svc_dc list_dumps
Du kan også prøve å finne dumpfiler fra PowerStore Manager. Hvis du vil ha mer informasjon, kan du se PowerStore: Slik genererer og samler du inn ulike logger fra PowerStore.
Hvis du vil logge på nodene over ssh, kan du finne IP-adressen for klyngen eller noden i PowerStore Manager under Settings > Network IPs (Innstillinger > nettverks-IP-er). Logg på med din foretrukne ssh-klient ved hjelp av servicebrukerkontoen og det respektive servicebrukerpassordet (definert under oppsettet av systemet).
Dette er også nyttig ettersom enkelte uventede omstarter kanskje ikke produserer en dumpfil.
Kontrollere varsler og hendelser fra PowerStore Manager (GUI)
Kontroller hendelser og varsler som kan indikere en uventet omstart av en node:- I PowerStore Manager kontrollerer du overvåkingsdelen og ser på detaljene under fanene VARSLER og HENDELSER .
- Se etter tidsstempler, feil- eller hendelseskoder, meldinger osv. Hvis du vil gjøre søket tydeligere, kan du bruke filteralternativene i fanene ALERTS (VARSLER og HENDELSEr):
Søke etter dumpfiler
Kontroller om det finnes systemdumpfiler på feiltidspunktet. Kjernedumper er ikke inkludert i datainnsamlinger.Logg på klyngen over ssh og kjør svc_dc list_dumps
Du kan også prøve å finne dumpfiler fra PowerStore Manager. Hvis du vil ha mer informasjon, kan du se PowerStore: Slik genererer og samler du inn ulike logger fra PowerStore.
Hvis du vil logge på nodene over ssh, kan du finne IP-adressen for klyngen eller noden i PowerStore Manager under Settings > Network IPs (Innstillinger > nettverks-IP-er). Logg på med din foretrukne ssh-klient ved hjelp av servicebrukerkontoen og det respektive servicebrukerpassordet (definert under oppsettet av systemet).
Kontrollere oppetiden på begge nodene
Kjør kommandoens oppetid på begge nodene. Dette vil fortelle deg hvor lenge noden hadde vært oppe og bidra til å bekrefte mulige omstarter.Dette er også nyttig ettersom enkelte uventede omstarter kanskje ikke produserer en dumpfil.
Andre indikatorer
Et mellomrom i ytelsesgrafene i PowerStore Manager kan også indikere omstart av en node. Dette bør bare brukes til veiledning, og du må bekrefte med flere bevis som foreslått ovenfor. Ytelsesgrafer er tilgjengelige enten fra instrumentbord > YTELSE eller maskinvare > Appliance X > Performance.Informazioni aggiuntive
Hva er nødvendig for RCA (Root Cause Analysis)?
- Støttemateriell fra alle apparatene i klyngen. Disse skal samles inn så nær omstarten som mulig.
- Dumpfilen
Prodotti interessati
PowerStoreProprietà dell'articolo
Numero articolo: 000130141
Tipo di articolo: Solution
Ultima modifica: 16 ago 2023
Versione: 14
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.