Data Domain: Omstart sløyfe etter kontrolleroppgradering – uten minne og ingen drepbare prosesser

Summary: Etter en kontrolleroppgradering starter systemet på nytt innen 5 minutter etter at du har aktivert filsystemet (FS). Den grunnleggende årsaken er en Out of Memory-tilstand (OOM) som forårsaker kjernepanikk. Systemet rapporterer "Ikke nok minne" forårsaket av en ugyldig registerinnstilling. Dette kan løses ved å fjerne 'systemet. MEM_HUGETLB=USANN' registernøkkel og starter systemet på nytt. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Symptomer:

  • DD starter på nytt etter kontrolleroppgradering. Når filsystemet (FS) er aktivert, starter DD på nytt innen 5 minutter.
    • Deaktiver FS for å forhindre omstartssløyfe (kjernepanikk)
  • Det finnes kjernepanikkmeldinger i loggene.
  • Det finnes feil i loggene for tomt minne.
    • I kern.info: 'Kernel panic - ikke synkronisering: Uten minne og ingen drepbare prosesser '

Kern.info viser feilmeldinger om at minnet ikke fungerer:

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Systemet starter på nytt etter en kontrolleroppgradering (for eksempel fra DD9300 til DD9900). Filsystemet ble deaktivert for å hindre at DD starter på nytt i en sløyfe.
Kjerneloggene viser flere feil uten minne (OOM), som utløser kjernepanikk og påfølgende omstarter.

Den grunnleggende årsaken til problemet er at det ikke er nok minne tilgjengelig til at systemet fungerer som det skal. Dette kan skyldes flere årsaker, inkludert, men ikke begrenset til:

  • En minnelekkasje i systemprogramvaren
  • Ikke nok minne tildelt for bestemte prosesser eller tjenester
  • Feil systemkonfigurasjon fører til overdreven minnebruk
  • Maskinvareproblemer, for eksempel defekte minnemoduler eller andre komponenter
  • En ugyldig registernøkkel kan ha blitt angitt, støtte må fjerne denne nøkkelen; system. MEM_HUGETLB=USANN.

Ytterligere undersøkelser er nødvendig for å identifisere den eksakte årsaken til minneutmattelsen og adressere den deretter. 

Gjennomgå systemlogger og feilmeldinger for å identifisere bestemte prosesser eller tjenester som kan bruke mye minne og forårsake OOM-feil.
Kontroll av systemets minnebruk og konfigurasjon kan også bidra til å identifisere eventuelle feilkonfigurasjoner eller maskinvareproblemer som kan bidra til problemet.
For eksempel: Manglende eller feilplasserte DIMM-er kan føre til en konfigurasjon som ikke støttes. som hindrer FS i å starte.

Resolution

  1. Kontroller systemloggene for eventuelle feilmeldinger eller advarsler relatert til minnebruk eller feilkonfigurasjon av systemet. Ta tak i disse deretter.
  2. Hvis problemet vedvarer, kan du vurdere å kontakte Dells kundestøtte for å få mer hjelp. Sørg for å oppgi relevante systemlogger eller diagnostisk informasjon for å feilsøke problemet.
    • Støttepakke og relevant kjerne |Kjernedumpfiler som skal lastes opp

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.