Data Domain: Geheugenkaart of DIMM met fout Mislukt of defect
Summary: Dit document helpt u bij het identificeren van de fout of fout en biedt een oplossingspad.
Symptoms
Van toepassing op:
- Alle Data Domain-systemen
- Alle softwareversies van Data Domain Operating System (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
De DIMM's die op Data Domain systemen zijn geïnstalleerd, zijn voorzien van Error Checking Code (ECC) waarmee herstelbare geheugenfouten snel kunnen worden hersteld. Als een foutdrempel wordt overschreden, identificeert DDOS de fout en wordt een passende waarschuwing op het systeem gegenereerd.
Onherstelbare geheugenfouten kunnen leiden tot een herstart van het systeem en worden beschouwd als een harde-geheugenfout. Een totale storing van een enkele DIMM of geheugenriser kan leiden tot een System Off-gebeurtenis waardoor het bestandssysteem niet kan worden ingeschakeld. Dit komt doordat het DDFS-proces (Data Domain File System) het grootste deel van het fysieke geheugen vult.
Resolution
OPMERKING: Als een DIMM-fout wordt gemeld op Dell PowerEdge systemen, is de eerste actie om te herstellen het opnieuw opstarten van de DataDomain-eenheid. Hiermee wordt PPR (POST Package Repair) gestart om de DIMM te herstellen.
Er moeten inspanningen worden geleverd om de oorzaak van het alarm vast te stellen, de DIMM's, CPU of het moederbord te identificeren en zo nodig onderdelen te vervangen.
Verzamel indien mogelijk een supportbundel en maak een serviceaanvraag aan bij uw gecontracteerde serviceprovider. In de volgende video ziet u hoe u een ondersteuningsbundel verzamelt: Verzamel een ondersteuningsbundel
Richtlijnen voor besluitvorming:
- Start voor Dell PowerEdge systemen het systeem opnieuw op om automatische POST-Package Repair (PPR) te vergemakkelijken; voor het herstel van de DIMM.
- Verbeteringen in de BIOS-firmware maken het mogelijk dat PPR DIMM-corrigeerbare en niet-corrigeerbare fouten herstelt (referentie)
- Vergelijk de huidige systeemstatus met een automatische ondersteuning van VOOR de DIMM-fout of -waarschuwing
- Handige DD-CLI (SSH) commando's voor het controleren van het geheugen:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Gebruik DDOS Offline Diagnostics om fouten te testen en vast te stellen. Ga naar Dell Support om toegang te krijgen tot de gebruikershandleiding voor Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite
- Voer indien mogelijk fysieke probleemoplossingsmethoden uit om defecte componenten te elimineren en vast te stellen (met behulp van gedocumenteerde vervangingsgidsen en -procedures).
- Plaats de DIMM opnieuw - zorg ervoor dat beide zijden goed zijn vergrendeld.
- Verwissel deze met een goed werkende DIMM van een ander slot, kanaal, bank of controller:
- Als een systeem niet werkt (niet opstart) vanwege een vermoedelijke geheugen-/dimm-fout, probeer dan een minimale opstartoptie (verwijder randapparaten of kaarten en laat 1x DIMM in slot '0' staan)
Additional Information
- Zie knowledge article 130388: PowerProtect- en Data Domain-hardwaredocumenten voor relevante informatie over DIMM-configuratie en -lay-out.
- Zie gerelateerd kennisartikel 82030: Data Domain: Systeemgeheugenvereisten en uitgebreide storageconfiguraties