Data Domain: Omstart sløyfe etter kontrolleroppgradering – uten minne og ingen drepbare prosesser
Summary: Etter en kontrolleroppgradering starter systemet på nytt innen 5 minutter etter at du har aktivert filsystemet (FS). Den grunnleggende årsaken er en Out of Memory-tilstand (OOM) som forårsaker kjernepanikk. Systemet rapporterer "Ikke nok minne" forårsaket av en ugyldig registerinnstilling. Dette kan løses ved å fjerne 'systemet. MEM_HUGETLB=USANN' registernøkkel og starter systemet på nytt. ...
Symptoms
Symptomer:
- DD starter på nytt etter kontrolleroppgradering. Når filsystemet (FS) er aktivert, starter DD på nytt innen 5 minutter.
- Deaktiver FS for å forhindre omstartssløyfe (kjernepanikk)
- Det finnes kjernepanikkmeldinger i loggene.
- Det finnes feil i loggene for tomt minne.
- I kern.info: 'Kernel panic - ikke synkronisering: Uten minne og ingen drepbare prosesser '
Kern.info viser feilmeldinger om at minnet ikke fungerer:
Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child
Cause
Systemet starter på nytt etter en kontrolleroppgradering (for eksempel fra DD9300 til DD9900). Filsystemet ble deaktivert for å hindre at DD starter på nytt i en sløyfe.
Kjerneloggene viser flere feil uten minne (OOM), som utløser kjernepanikk og påfølgende omstarter.
Den grunnleggende årsaken til problemet er at det ikke er nok minne tilgjengelig til at systemet fungerer som det skal. Dette kan skyldes flere årsaker, inkludert, men ikke begrenset til:
- En minnelekkasje i systemprogramvaren
- Ikke nok minne tildelt for bestemte prosesser eller tjenester
- Feil systemkonfigurasjon fører til overdreven minnebruk
- Maskinvareproblemer, for eksempel defekte minnemoduler eller andre komponenter
- En ugyldig registernøkkel kan ha blitt angitt, støtte må fjerne denne nøkkelen; system. MEM_HUGETLB=USANN.
Ytterligere undersøkelser er nødvendig for å identifisere den eksakte årsaken til minneutmattelsen og adressere den deretter.
Gjennomgå systemlogger og feilmeldinger for å identifisere bestemte prosesser eller tjenester som kan bruke mye minne og forårsake OOM-feil.
Kontroll av systemets minnebruk og konfigurasjon kan også bidra til å identifisere eventuelle feilkonfigurasjoner eller maskinvareproblemer som kan bidra til problemet.
For eksempel: Manglende eller feilplasserte DIMM-er kan føre til en konfigurasjon som ikke støttes. som hindrer FS i å starte.
Resolution
- Kontroller systemloggene for eventuelle feilmeldinger eller advarsler relatert til minnebruk eller feilkonfigurasjon av systemet. Ta tak i disse deretter.
- Hvis problemet vedvarer, kan du vurdere å kontakte Dells kundestøtte for å få mer hjelp. Sørg for å oppgi relevante systemlogger eller diagnostisk informasjon for å feilsøke problemet.
- Støttepakke og relevant kjerne |Kjernedumpfiler som skal lastes opp