Data Domain: Hukommelseskort eller DIMM med mislykket eller defekt fejl

Summary: Dette dokument tjener til at hjælpe med at identificere fejlen eller og fejlen og give en løsningssti.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain-systemer (DD) overvåger status for systemhukommelseshardware (DIMM'er). Hvis der opstår DIMM-relaterede fejl, vises en relevant advarselsmeddelelse.

Gælder for:
  • Alle Data Domain-systemer
  • Alle softwareversioner af Data Domain Operating System (DDOS)
Mulige advarselsmeddelelser indsendt af DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

De DIMM-moduler, der er installeret på Data Domain-systemer, har ECC (Error Checking Code), som gør det muligt at rette hukommelsesfejl, der kan rettes, på farten. Hvis en fejltærskel overskrides, identificerer DDOS fejlen, og der genereres en passende advarsel på systemet.

Hukommelsesfejl, der ikke kan rettes, kan forårsage genstart af systemet og betragtes som en hård hukommelsesfejl. Total fejl i en enkelt DIMM- eller hukommelsesudvidelse kan resultere i en systemlukningshændelse og forhindre filsystemet i at blive aktiveret. Dette skyldes, at DDFS-processen (Data Domain File System) fylder det meste af den fysiske hukommelse.

BEMÆRK: Andre symptomer eller advarsler kan maskere hukommelsesfejl - for eksempel CPU Machine Check Error - Dybere loganalyse og fejlfinding kan være påkrævet.

Resolution

BEMÆRK: Hvis der rapporteres en DIMM-fejl på Dell PowerEdge-baserede systemer, er det første, der skal genoprettes, at genstarte DataDomain-enheden. Dette vil starte PPR (POST Package Repair) for at gendanne DIMM-modulet.

Der skal gøres en indsats for at fastslå årsagen til advarslen og identificere den berørte komponent DIMM-moduler, CPU eller bundkort samt udskifte dele efter behov. 

Hvis det er muligt, skal du indsamle en supportpakke og oprette en serviceanmodning hos den serviceudbyder, du har indgået kontrakt med. Følgende video viser, hvordan du indsamler en supportpakke: Saml en supportpakkeDette hyperlink fører dig til et websted uden for Dell Technologies.

Retningslinjer for afvikling:

  • For Dell PowerEdge-baserede systemer skal du starte en systemgenstart for at muliggøre automatisk POST-pakkereparation (PPR). til gendannelse af DIMM-modulet.
    • Forbedringer i BIOS-firmware gør det muligt for PPR at gendanne DIMM-fejl, der kan rettes og ikke kan rettes (reference)
  • Sammenlign den aktuelle systemtilstand med en automatisk support fra FØR DIMM-fejlen.
  • Nyttige DD-CLI-KOMMANDOER (SSH) til kontrol af hukommelse:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Brug DDOS offlinediagnosticering til at teste og fastslå fejl. Gå til Dell Support for at få adgang til Dell EMC Data Domain Operating System 6.x Brugervejledning til Offline Diagnostics Suite
  • Hvis det er muligt, skal du udføre fysiske fejlfindingsmetoder for at eliminere og bestemme defekt komponent (ved hjælp af dokumenterede udskiftningsvejledninger og -procedurer).
  • Sæt DIMM-modulet ordentligt på plads – sørg for, at begge sider er låst korrekt.
  • Skift det med et DIMM-modul, som du ved fungerer, fra en anden slot, kanal, bank eller controller:
  • Hvis et system er nede (ingen opstart) på grund af en mistanke om hukommelse-/DIMM-fejl, kan du prøve en minimal opstartsindstilling (fjern eksterne enheder eller kort, og lad 1 x DIMM blive i slot '0')

Additional Information

Referencer:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.