Data Domain: Smyčka restartu po upgradu řadiče – nedostatek paměti a žádné procesy, které lze ukončit.

Summary: Po upgradu řadiče se systém restartuje do 5 minut od povolení souborového systému (FS). Hlavní příčinou je nedostatek paměti (OOM), který způsobuje paniku jádra. Systém hlásí nedostatek paměti způsobený neplatným nastavením registru. Tento problém lze vyřešit odebráním systému 'system. MEM_HUGETLB=FALSE' a restartování systému. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Příznaky:

  • Po upgradu řadiče se DD neustále restartuje; Když je systém souborů (FS) povolen, systém DD se restartuje během 5 minut.
    • Zakažte systém souborů, abyste zabránili smyčce restartování (panika jádra).
  • V protokolech se nacházejí zprávy kernel panic.
  • V protokolech jsou přítomny chyby nedostatku paměti.
    • V kern.info: 'Kernel panic - not syncing: Nedostatek paměti a žádné procesy, které by bylo možné zabít

Kern.info zobrazuje chyby "Nedostatek paměti":

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Po upgradu řadiče (např. z verze DD9300 na DD9900) se systém neustále restartuje. Systém souborů byl zakázán, aby se systém DD nerestartoval ve smyčce.
Protokoly jádra zobrazují několik chyb OOM (Out of Memory), které spouštějí paniku jádra a následné restarty.

Hlavní příčinou problému je nedostatek dostupné paměti pro správné fungování systému. To může být způsobeno několika důvody, mimo jiné:

  • Nevrácení paměti v systémovém softwaru
  • Nedostatečná paměť přidělená konkrétním procesům nebo službám
  • Nesprávná konfigurace systému vedoucí k nadměrnému využití paměti
  • Problémy s hardwarem, například vadné paměťové moduly nebo jiné komponenty
  • Je možné, že byl nastaven neplatný klíč registru, podpora musí tento klíč odebrat. systém. MEM_HUGETLB=NEPRAVDA.

K identifikaci přesné příčiny vyčerpání paměti a jejímu příslušnému řešení je zapotřebí další vyšetření. 

Zkontrolujte systémové protokoly a chybové zprávy a identifikujte všechny konkrétní procesy nebo služby, které mohou spotřebovávat nadměrné množství paměti a způsobovat chyby OOM.
Kontrola využití paměti a konfigurace systému může také pomoci odhalit jakékoli nesprávné konfigurace nebo problémy s hardwarem, které by mohly k problému přispívat.
Například: Chybějící nebo nesprávně umístěné moduly DIMM mohou mít za následek nepodporovanou konfiguraci. který zabrání spuštění FS.

Resolution

  1. Zkontrolujte, zda se v systémových protokolech nevyskytují chybové zprávy či varování týkající se využití paměti nebo nesprávné konfigurace systému; odpovídajícím způsobem je řešte.
  2. Pokud problém přetrvává, zvažte kontaktování podpory společnosti Dell a požádejte o další pomoc. Nezapomeňte poskytnout příslušné systémové protokoly nebo diagnostické informace, které vám pomohou problém vyřešit.
    • Balíček podpory a příslušné Core|Soubory výpisu jádra k nahrání

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.