Data Domain: Omstartslinga efter styrenhetsuppgradering – slut på minne och inga dödbara processer
Summary: Efter en styrenhetsuppgradering fortsätter systemet att starta om inom 5 minuter efter att filsystemet (FS) aktiverats. Rotorsaken är ett OOM-tillstånd (Out of Memory), vilket orsakar kernelpanik. Systemet rapporterar "Slut på minne" som orsakas av en ogiltig registerinställning. Detta kan lösas genom att ta bort 'systemet. MEM_HUGETLB=FALSE' registernyckel och startar om systemet. ...
Symptoms
Symptom:
- DD fortsätter att starta om efter uppgradering av styrenheten. När filsystemet (FS) är aktiverat startas DD om inom 5 minuter.
- Avaktivera FS för att förhindra omstartsslingan (kernelpanik)
- Kernel Panic-meddelanden finns i loggarna.
- Minnesfel förekommer i loggarna.
- I kern.info: "Kernel panic - synkroniseras inte: Slut på minne och inga processer som går att döda"
Kern.info visar felet "Slut på minne":
Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child
Cause
Systemet fortsätter att starta om efter en styrenhetsuppgradering (till exempel från DD9300 till DD9900). Filsystemet inaktiverades för att förhindra att DD startas om i en loop.
Kernelloggarna visar flera OOM-fel (Out of Memory), vilket utlöser kernelpanik och efterföljande omstarter.
Grundorsaken till problemet är att det inte finns tillräckligt med minne för att systemet ska fungera korrekt. Detta kan bero på flera orsaker, inklusive men inte begränsat till:
- En minnesläcka i systemprogramvaran
- Otillräckligt minne allokerat för specifika processer eller tjänster
- Felaktig systemkonfiguration som leder till överdriven minnesanvändning
- Maskinvaruproblem, t.ex. felaktiga minnesmoduler eller andra komponenter
- En ogiltig registernyckel kan ha angetts, supporten måste ta bort den här nyckeln. system. MEM_HUGETLB=FALSKT.
Ytterligare undersökningar krävs för att identifiera den exakta orsaken till minnesutmattningen och ta itu med den därefter.
Granska systemloggar och felmeddelanden för att identifiera specifika processer eller tjänster som kan förbruka för mycket minne och orsaka OOM-felen.
Att kontrollera systemets minnesanvändning och konfiguration kan också hjälpa till att identifiera eventuella felkonfigurationer eller hårdvaruproblem som kan bidra till problemet.
Till exempel: Saknade eller felplacerade DIMM-moduler kan resultera i en konfiguration som inte stöds. vilket hindrar FS från att starta.
Resolution
- Kontrollera om det finns felmeddelanden eller varningar i systemloggarna som rör minnesanvändning eller felaktig systemkonfiguration. ta itu med dessa i enlighet med detta.
- Om problemet kvarstår kan du kontakta Dells support för ytterligare hjälp. Se till att tillhandahålla relevanta systemloggar eller diagnostikinformation för att hjälpa till att felsöka problemet.
- Supportpaket och relevant kärna |Kerneldumpfiler som ska laddas upp