Data Domain: Zobrazuje se chyba selhání či závady paměti nebo modulu DIMM

Summary: Tento dokument vám pomůže identifikovat chybu nebo závadu a poskytne řešení.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Systémy Data Domain (DD) monitorují stav hardwaru systémové paměti (DIMM). Pokud dojde k chybám souvisejícím s moduly DIMM, zobrazí se příslušné výstražné oznámení.

Platí pro:
  • Všechny systémy Data Domain
  • Všechny verze operačního systému Data Domain (DDOS)
Možná upozornění v systému DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

Moduly DIMM nainstalované v systémech Data Domain mají funkci ECC (Error Checking Code), která umožňuje opravit chyby paměti za běhu. Pokud dojde k překročení prahové hodnoty chyby, systém DDOS chybu identifikuje a v systému se vygeneruje příslušná výstraha.

Neopravitelné chyby paměti mohou způsobit restart systému a jsou považovány za chybu pevné paměti. Celkové selhání libovolného modulu DIMM nebo riseru paměti může způsobit událost vypnutí systému a zabránit povolení systému souborů. Důvodem je to, že proces DDFS (Data Domain File System) zaplní většinu fyzické paměti.

POZNÁMKA: Další příznaky nebo výstrahy mohou maskovat chyby paměti (například chyba CPU Machine Check Error) a může být vyžadována hlubší analýza protokolu a odstraňování problémů.

Resolution

POZNÁMKA: Pokud je v systémech Dell PowerEdge hlášena chyba DIMM, první akcí, kterou je třeba obnovit, je restartování jednotky DataDomain. Tím se spustí oprava PPR (POST Package Repair) k obnovení modulu DIMM.

Je třeba určit příčinu výstrahy, identifikovat dotčené komponenty modulů DIMM, procesoru nebo základní desky a dle potřeby vyměnit díly. 

Pokud je to možné, shromážděte balíček podpory a vytvořte servisní požadavek u smluvního poskytovatele služeb. Následující video ukazuje, jak shromáždit balíček podpory: Shromáždění balíčku podporyTento hypertextový odkaz vás zavede na webové stránky mimo společnost Dell Technologies.

Pokyny k řešení:

  • U systémů založených na Dell PowerEdge zahájení restartování systému, což usnadní automatickou opravu po balíčku (PPR); pro obnovení modulu DIMM.
    • Vylepšení firmwaru systému BIOS umožňují nástroji PPR obnovit opravitelné a neopravitelné chyby modulů DIMM (reference)
  • Porovnejte aktuální stav systému s automatickou podporou PŘED selháním nebo výstrahou modulu DIMM.
  • Užitečné příkazy DD-CLI (SSH) pro kontrolu paměti:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Pomocí offline diagnostiky DDOS otestujte a určete závadu. Přejděte na stránky podpory společnosti Dell a otevřete uživatelskou příručku k sadě offline diagnostiky operačního systému Dell EMC Data Domain 6.x
  • Pokud je to možné, určete a odstraňte vadné součásti provedením fyzických postupů odstraňování problémů (pomocí uvedených postupů a průvodců pro výměnu).
  • Znovu usaďte modul DIMM – ujistěte se, že jsou obě strany řádně zajištěny.
  • Vyměňte jej za ověřený funkční modul DIMM z jiného slotu, kanálu, banky nebo řadiče:
  • Pokud je systém mimo provoz (nelze spustit) z důvodu podezření na chybu paměti / modulu DIMM, zkuste použít možnost minimálního spuštění (odeberte periferní zařízení nebo karty a ponechte 1 modul DIMM ve slotu 0).

Additional Information

Odkazy:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.