Data Domain: Zobrazuje se chyba selhání či závady paměti nebo modulu DIMM
Summary: Tento dokument vám pomůže identifikovat chybu nebo závadu a poskytne řešení.
Symptoms
Platí pro:
- Všechny systémy Data Domain
- Všechny verze operačního systému Data Domain (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
Moduly DIMM nainstalované v systémech Data Domain mají funkci ECC (Error Checking Code), která umožňuje opravit chyby paměti za běhu. Pokud dojde k překročení prahové hodnoty chyby, systém DDOS chybu identifikuje a v systému se vygeneruje příslušná výstraha.
Neopravitelné chyby paměti mohou způsobit restart systému a jsou považovány za chybu pevné paměti. Celkové selhání libovolného modulu DIMM nebo riseru paměti může způsobit událost vypnutí systému a zabránit povolení systému souborů. Důvodem je to, že proces DDFS (Data Domain File System) zaplní většinu fyzické paměti.
Resolution
POZNÁMKA: Pokud je v systémech Dell PowerEdge hlášena chyba DIMM, první akcí, kterou je třeba obnovit, je restartování jednotky DataDomain. Tím se spustí oprava PPR (POST Package Repair) k obnovení modulu DIMM.
Je třeba určit příčinu výstrahy, identifikovat dotčené komponenty modulů DIMM, procesoru nebo základní desky a dle potřeby vyměnit díly.
Pokud je to možné, shromážděte balíček podpory a vytvořte servisní požadavek u smluvního poskytovatele služeb. Následující video ukazuje, jak shromáždit balíček podpory: Shromáždění balíčku podpory
Pokyny k řešení:
- U systémů založených na Dell PowerEdge zahájení restartování systému, což usnadní automatickou opravu po balíčku (PPR); pro obnovení modulu DIMM.
- Vylepšení firmwaru systému BIOS umožňují nástroji PPR obnovit opravitelné a neopravitelné chyby modulů DIMM (reference)
- Porovnejte aktuální stav systému s automatickou podporou PŘED selháním nebo výstrahou modulu DIMM.
- Užitečné příkazy DD-CLI (SSH) pro kontrolu paměti:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Pomocí offline diagnostiky DDOS otestujte a určete závadu. Přejděte na stránky podpory společnosti Dell a otevřete uživatelskou příručku k sadě offline diagnostiky operačního systému Dell EMC Data Domain 6.x
- Pokud je to možné, určete a odstraňte vadné součásti provedením fyzických postupů odstraňování problémů (pomocí uvedených postupů a průvodců pro výměnu).
- Znovu usaďte modul DIMM – ujistěte se, že jsou obě strany řádně zajištěny.
- Vyměňte jej za ověřený funkční modul DIMM z jiného slotu, kanálu, banky nebo řadiče:
- Pokud je systém mimo provoz (nelze spustit) z důvodu podezření na chybu paměti / modulu DIMM, zkuste použít možnost minimálního spuštění (odeberte periferní zařízení nebo karty a ponechte 1 modul DIMM ve slotu 0).
Additional Information
- Viz článek znalostní databáze 130388: Dokumentace k hardwaru systému PowerProtect a Data Domain, kde najdete relevantní informace o konfiguraci a rozložení modulů DIMM.
- Viz související článek znalostní databáze 82030: Data Domain: Požadavky na paměť systému a konfigurace rozšířeného úložiště