Data Domain: Zobrazuje se chyba selhání či závady paměti nebo modulu DIMM
Zusammenfassung: Tento dokument vám pomůže identifikovat chybu nebo závadu a poskytne řešení.
Symptome
Platí pro:
- Všechny systémy Data Domain
- Všechny verze operačního systému Data Domain (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Ursache
Moduly DIMM nainstalované v systémech Data Domain mají funkci ECC (Error Checking Code), která umožňuje opravit chyby paměti za běhu. Pokud dojde k překročení prahové hodnoty chyby, systém DDOS chybu identifikuje a v systému se vygeneruje příslušná výstraha.
Neopravitelné chyby paměti mohou způsobit restart systému a jsou považovány za chybu pevné paměti. Celkové selhání libovolného modulu DIMM nebo riseru paměti může způsobit událost vypnutí systému a zabránit povolení systému souborů. Důvodem je to, že proces DDFS (Data Domain File System) zaplní většinu fyzické paměti.
Lösung
Je třeba určit příčinu výstrahy, identifikovat dotčené komponenty modulů DIMM, procesoru nebo základní desky a dle potřeby vyměnit díly.
Pokud je to možné, shromážděte balíček podpory a vytvořte servisní požadavek u smluvního poskytovatele služeb. Následující video ukazuje, jak shromáždit balíček podpory: Shromáždění balíčku podpory
Pokyny k řešení:
- U systémů založených na Dell PowerEdge zahájení restartování systému, což usnadní automatickou opravu po balíčku (PPR); pro obnovení modulu DIMM.
- Vylepšení firmwaru systému BIOS umožňují nástroji PPR obnovit opravitelné a neopravitelné chyby modulů DIMM (reference)
- Porovnejte aktuální stav systému s automatickou podporou PŘED selháním nebo výstrahou modulu DIMM.
- Užitečné příkazy DD-CLI (SSH) pro kontrolu paměti:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Pomocí offline diagnostiky DDOS otestujte a určete závadu. Přejděte na stránky podpory společnosti Dell a otevřete uživatelskou příručku k sadě offline diagnostiky operačního systému Dell EMC Data Domain 6.x
- Pokud je to možné, určete a odstraňte vadné součásti provedením fyzických postupů odstraňování problémů (pomocí uvedených postupů a průvodců pro výměnu).
- Znovu usaďte modul DIMM – ujistěte se, že jsou obě strany řádně zajištěny.
- Vyměňte jej za ověřený funkční modul DIMM z jiného slotu, kanálu, banky nebo řadiče:
- Pokud je systém mimo provoz (nelze spustit) z důvodu podezření na chybu paměti / modulu DIMM, zkuste použít možnost minimálního spuštění (odeberte periferní zařízení nebo karty a ponechte 1 modul DIMM ve slotu 0).
Weitere Informationen
- Viz článek znalostní databáze 130388: Dokumentace k hardwaru systému PowerProtect a Data Domain, kde najdete relevantní informace o konfiguraci a rozložení modulů DIMM.
- Viz související článek znalostní databáze 82030: Data Domain: Požadavky na paměť systému a konfigurace rozšířeného úložiště