Data Domain: Omstartslinga efter styrenhetsuppgradering – slut på minne och inga dödbara processer

Summary: Efter en styrenhetsuppgradering fortsätter systemet att starta om inom 5 minuter efter att filsystemet (FS) aktiverats. Rotorsaken är ett OOM-tillstånd (Out of Memory), vilket orsakar kernelpanik. Systemet rapporterar "Slut på minne" som orsakas av en ogiltig registerinställning. Detta kan lösas genom att ta bort 'systemet. MEM_HUGETLB=FALSE' registernyckel och startar om systemet. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Symptom:

  • DD fortsätter att starta om efter uppgradering av styrenheten. När filsystemet (FS) är aktiverat startas DD om inom 5 minuter.
    • Avaktivera FS för att förhindra omstartsslingan (kernelpanik)
  • Kernel Panic-meddelanden finns i loggarna.
  • Minnesfel förekommer i loggarna.
    • I kern.info: "Kernel panic - synkroniseras inte: Slut på minne och inga processer som går att döda"

Kern.info visar felet "Slut på minne":

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Systemet fortsätter att starta om efter en styrenhetsuppgradering (till exempel från DD9300 till DD9900). Filsystemet inaktiverades för att förhindra att DD startas om i en loop.
Kernelloggarna visar flera OOM-fel (Out of Memory), vilket utlöser kernelpanik och efterföljande omstarter.

Grundorsaken till problemet är att det inte finns tillräckligt med minne för att systemet ska fungera korrekt. Detta kan bero på flera orsaker, inklusive men inte begränsat till:

  • En minnesläcka i systemprogramvaran
  • Otillräckligt minne allokerat för specifika processer eller tjänster
  • Felaktig systemkonfiguration som leder till överdriven minnesanvändning
  • Maskinvaruproblem, t.ex. felaktiga minnesmoduler eller andra komponenter
  • En ogiltig registernyckel kan ha angetts, supporten måste ta bort den här nyckeln. system. MEM_HUGETLB=FALSKT.

Ytterligare undersökningar krävs för att identifiera den exakta orsaken till minnesutmattningen och ta itu med den därefter. 

Granska systemloggar och felmeddelanden för att identifiera specifika processer eller tjänster som kan förbruka för mycket minne och orsaka OOM-felen.
Att kontrollera systemets minnesanvändning och konfiguration kan också hjälpa till att identifiera eventuella felkonfigurationer eller hårdvaruproblem som kan bidra till problemet.
Till exempel: Saknade eller felplacerade DIMM-moduler kan resultera i en konfiguration som inte stöds. vilket hindrar FS från att starta.

Resolution

  1. Kontrollera om det finns felmeddelanden eller varningar i systemloggarna som rör minnesanvändning eller felaktig systemkonfiguration. ta itu med dessa i enlighet med detta.
  2. Om problemet kvarstår kan du kontakta Dells support för ytterligare hjälp. Se till att tillhandahålla relevanta systemloggar eller diagnostikinformation för att hjälpa till att felsöka problemet.
    • Supportpaket och relevant kärna |Kerneldumpfiler som ska laddas upp

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.