Data Domain: Geheugenkaart of DIMM met fout Mislukt of defect

Summary: Dit document helpt u bij het identificeren van de fout of fout en biedt een oplossingspad.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain (DD)-systemen bewaken de status van systeemgeheugenhardware (DIMM's). Als er DIMM-gerelateerde fouten worden aangetroffen, wordt een passende waarschuwingsmelding geplaatst.

Van toepassing op:
  • Alle Data Domain-systemen
  • Alle softwareversies van Data Domain Operating System (DDOS)
Mogelijke waarschuwingsmeldingen geplaatst door DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

De DIMM's die op Data Domain systemen zijn geïnstalleerd, zijn voorzien van Error Checking Code (ECC) waarmee herstelbare geheugenfouten snel kunnen worden hersteld. Als een foutdrempel wordt overschreden, identificeert DDOS de fout en wordt een passende waarschuwing op het systeem gegenereerd.

Onherstelbare geheugenfouten kunnen leiden tot een herstart van het systeem en worden beschouwd als een harde-geheugenfout. Een totale storing van een enkele DIMM of geheugenriser kan leiden tot een System Off-gebeurtenis waardoor het bestandssysteem niet kan worden ingeschakeld. Dit komt doordat het DDFS-proces (Data Domain File System) het grootste deel van het fysieke geheugen vult.

OPMERKING: Andere symptomen of waarschuwingen kunnen geheugenfouten maskeren, bijvoorbeeld fout bij controle CPU-apparaat. Mogelijk is diepere logboekanalyse en probleemoplossing vereist.

Resolution

OPMERKING: Als een DIMM-fout wordt gemeld op Dell PowerEdge systemen, is de eerste actie om te herstellen het opnieuw opstarten van de DataDomain-eenheid. Hiermee wordt PPR (POST Package Repair) gestart om de DIMM te herstellen.

Er moeten inspanningen worden geleverd om de oorzaak van het alarm vast te stellen, de DIMM's, CPU of het moederbord te identificeren en zo nodig onderdelen te vervangen. 

Verzamel indien mogelijk een supportbundel en maak een serviceaanvraag aan bij uw gecontracteerde serviceprovider. In de volgende video ziet u hoe u een ondersteuningsbundel verzamelt: Verzamel een ondersteuningsbundelDeze hyperlink leidt u naar een website buiten Dell Technologies.

Richtlijnen voor besluitvorming:

  • Start voor Dell PowerEdge systemen het systeem opnieuw op om automatische POST-Package Repair (PPR) te vergemakkelijken; voor het herstel van de DIMM.
    • Verbeteringen in de BIOS-firmware maken het mogelijk dat PPR DIMM-corrigeerbare en niet-corrigeerbare fouten herstelt (referentie)
  • Vergelijk de huidige systeemstatus met een automatische ondersteuning van VOOR de DIMM-fout of -waarschuwing
  • Handige DD-CLI (SSH) commando's voor het controleren van het geheugen:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Gebruik DDOS Offline Diagnostics om fouten te testen en vast te stellen. Ga naar Dell Support om toegang te krijgen tot de gebruikershandleiding voor Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite
  • Voer indien mogelijk fysieke probleemoplossingsmethoden uit om defecte componenten te elimineren en vast te stellen (met behulp van gedocumenteerde vervangingsgidsen en -procedures).
  • Plaats de DIMM opnieuw - zorg ervoor dat beide zijden goed zijn vergrendeld.
  • Verwissel deze met een goed werkende DIMM van een ander slot, kanaal, bank of controller:
  • Als een systeem niet werkt (niet opstart) vanwege een vermoedelijke geheugen-/dimm-fout, probeer dan een minimale opstartoptie (verwijder randapparaten of kaarten en laat 1x DIMM in slot '0' staan)

Additional Information

Verwijzingen:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.