Data Domain: Genstartsløjfe efter controlleropgradering – der er løbet tør for hukommelse og ingen processer, der kan dræbes

Summary: Efter en controlleropgradering fortsætter systemet med at genstarte inden for 5 minutter efter aktivering af filsystemet (FS). Den grundlæggende årsag er en OOM-tilstand (Out of Memory), der forårsager kernelpanik. Systemet rapporterer "Ikke mere hukommelse" forårsaget af en ugyldig indstilling i registreringsdatabasen. Dette kan løses ved at fjerne 'systemet. MEM_HUGETLB=FALSE' registreringsdatabasenøgle og genstart af systemet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Symptomer:

  • DD bliver ved med at genstarte efter controlleropgradering. når filsystemet (FS) er aktiveret, genstarter DD inden for 5 minutter.
    • Deaktiver FS for at forhindre genstartsløjfe (kernelpanik)
  • Kernel Panic-meddelelser findes i logfilerne.
  • Der er ikke mere hukommelse i logfilerne.
    • I kern.info: 'Kernepanik - synkroniserer ikke: Uden hukommelse og ingen processer, der kan dræbes'

Kern.info viser fejlmeddelelserne "Der er ikke mere hukommelse":

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Systemet bliver ved med at genstarte efter en controlleropgradering (f.eks. fra DD9300 til DD9900). Filsystemet blev deaktiveret for at forhindre DD i at genstarte i en løkke.
Kernelogfilerne viser flere OOM-fejl (Out of Memory), som udløser kernelpanikken og efterfølgende genstarter.

Den grundlæggende årsag til problemet er, at der ikke er tilstrækkelig tilgængelig hukommelse til, at systemet kan fungere korrekt. Dette kan skyldes flere årsager, herunder, men ikke begrænset til:

  • En hukommelseslækage i systemsoftwaren
  • Utilstrækkelig hukommelse allokeret til specifikke processer eller tjenester
  • Forkert systemkonfiguration, der fører til overdreven hukommelsesforbrug
  • Hardwareproblemer, såsom defekte hukommelsesmoduler eller andre komponenter
  • Der kan være indstillet en ugyldig registreringsdatabasenøgle. Support skal fjerne denne nøgle. system. MEM_HUGETLB=FALSK.

Yderligere undersøgelse er nødvendig for at identificere den nøjagtige årsag til hukommelsesudmattelse og adressere den i overensstemmelse hermed. 

Gennemgå systemlogfiler og fejlmeddelelser for at identificere specifikke processer eller tjenester, der muligvis bruger for meget hukommelse og forårsager OOM-fejlene.
En kontrol af systemets hukommelsesforbrug og konfiguration kan også hjælpe med at identificere eventuelle fejlkonfigurationer eller hardwareproblemer, der kan bidrage til problemet.
For eksempel: Manglende eller forkert placerede DIMM-moduler kan resultere i en ikke-understøttet konfiguration. hvilket forhindrer FS i at starte.

Resolution

  1. Kontroller systemlogfilerne for eventuelle fejlmeddelelser eller advarsler relateret til hukommelsesforbrug eller systemfejlkonfiguration; Adresser disse i overensstemmelse hermed.
  2. Hvis problemet stadig ikke er løst, kan du overveje at kontakte Dell Support for at få yderligere hjælp. Sørg for at levere relevante systemlogfiler eller diagnosticeringsoplysninger som hjælp til fejlfinding af problemet.
    • Supportpakke og relevant Core|Kernel Dump-filer, der skal uploades

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.