Data Domain: Zobrazuje se chyba selhání či závady paměti nebo modulu DIMM

Shrnutí: Tento dokument vám pomůže identifikovat chybu nebo závadu a poskytne řešení.

Tento článek se vztahuje na Tento článek se nevztahuje na Tento článek není vázán na žádný konkrétní produkt. V tomto článku nejsou uvedeny všechny verze produktu.

Příznaky

Systémy Data Domain (DD) monitorují stav hardwaru systémové paměti (DIMM). Pokud dojde k chybám souvisejícím s moduly DIMM, zobrazí se příslušné výstražné oznámení.

Platí pro:
  • Všechny systémy Data Domain
  • Všechny verze operačního systému Data Domain (DDOS)
Možná upozornění v systému DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Příčina

Moduly DIMM nainstalované v systémech Data Domain mají funkci ECC (Error Checking Code), která umožňuje opravit chyby paměti za běhu. Pokud dojde k překročení prahové hodnoty chyby, systém DDOS chybu identifikuje a v systému se vygeneruje příslušná výstraha.

Neopravitelné chyby paměti mohou způsobit restart systému a jsou považovány za chybu pevné paměti. Celkové selhání libovolného modulu DIMM nebo riseru paměti může způsobit událost vypnutí systému a zabránit povolení systému souborů. Důvodem je to, že proces DDFS (Data Domain File System) zaplní většinu fyzické paměti.

POZNÁMKA: Další příznaky nebo výstrahy mohou maskovat chyby paměti (například chyba CPU Machine Check Error) a může být vyžadována hlubší analýza protokolu a odstraňování problémů.

Řešení

POZNÁMKA: Pokud je v systémech Dell PowerEdge hlášena chyba DIMM, první akcí, kterou je třeba obnovit, je restartování jednotky DataDomain. Tím se spustí oprava PPR (POST Package Repair) k obnovení modulu DIMM.

Je třeba určit příčinu výstrahy, identifikovat dotčené komponenty modulů DIMM, procesoru nebo základní desky a dle potřeby vyměnit díly. 

Pokud je to možné, shromážděte balíček podpory a vytvořte servisní požadavek u smluvního poskytovatele služeb. Následující video ukazuje, jak shromáždit balíček podpory: Shromáždění balíčku podporyTento hypertextový odkaz vás zavede na webové stránky mimo společnost Dell Technologies.

Pokyny k řešení:

  • U systémů založených na Dell PowerEdge zahájení restartování systému, což usnadní automatickou opravu po balíčku (PPR); pro obnovení modulu DIMM.
    • Vylepšení firmwaru systému BIOS umožňují nástroji PPR obnovit opravitelné a neopravitelné chyby modulů DIMM (reference)
  • Porovnejte aktuální stav systému s automatickou podporou PŘED selháním nebo výstrahou modulu DIMM.
  • Užitečné příkazy DD-CLI (SSH) pro kontrolu paměti:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Pomocí offline diagnostiky DDOS otestujte a určete závadu. Přejděte na stránky podpory společnosti Dell a otevřete uživatelskou příručku k sadě offline diagnostiky operačního systému Dell EMC Data Domain 6.x
  • Pokud je to možné, určete a odstraňte vadné součásti provedením fyzických postupů odstraňování problémů (pomocí uvedených postupů a průvodců pro výměnu).
  • Znovu usaďte modul DIMM – ujistěte se, že jsou obě strany řádně zajištěny.
  • Vyměňte jej za ověřený funkční modul DIMM z jiného slotu, kanálu, banky nebo řadiče:
  • Pokud je systém mimo provoz (nelze spustit) z důvodu podezření na chybu paměti / modulu DIMM, zkuste použít možnost minimálního spuštění (odeberte periferní zařízení nebo karty a ponechte 1 modul DIMM ve slotu 0).

Další informace

Odkazy:

Dotčené produkty

Data Domain, Integrated Data Protection Appliance Family

Produkty

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Vlastnosti článku
Číslo článku: 000204330
Typ článku: Solution
Poslední úprava: 03 bře 2025
Verze:  11
Najděte odpovědi na své otázky od ostatních uživatelů společnosti Dell
Služby podpory
Zkontrolujte, zda se na vaše zařízení vztahují služby podpory.