Data Domain: Hukommelseskort eller DIMM med mislykket eller defekt fejl
Summary: Dette dokument tjener til at hjælpe med at identificere fejlen eller og fejlen og give en løsningssti.
Symptoms
Gælder for:
- Alle Data Domain-systemer
- Alle softwareversioner af Data Domain Operating System (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
De DIMM-moduler, der er installeret på Data Domain-systemer, har ECC (Error Checking Code), som gør det muligt at rette hukommelsesfejl, der kan rettes, på farten. Hvis en fejltærskel overskrides, identificerer DDOS fejlen, og der genereres en passende advarsel på systemet.
Hukommelsesfejl, der ikke kan rettes, kan forårsage genstart af systemet og betragtes som en hård hukommelsesfejl. Total fejl i en enkelt DIMM- eller hukommelsesudvidelse kan resultere i en systemlukningshændelse og forhindre filsystemet i at blive aktiveret. Dette skyldes, at DDFS-processen (Data Domain File System) fylder det meste af den fysiske hukommelse.
Resolution
BEMÆRK: Hvis der rapporteres en DIMM-fejl på Dell PowerEdge-baserede systemer, er det første, der skal genoprettes, at genstarte DataDomain-enheden. Dette vil starte PPR (POST Package Repair) for at gendanne DIMM-modulet.
Der skal gøres en indsats for at fastslå årsagen til advarslen og identificere den berørte komponent DIMM-moduler, CPU eller bundkort samt udskifte dele efter behov.
Hvis det er muligt, skal du indsamle en supportpakke og oprette en serviceanmodning hos den serviceudbyder, du har indgået kontrakt med. Følgende video viser, hvordan du indsamler en supportpakke: Saml en supportpakke
Retningslinjer for afvikling:
- For Dell PowerEdge-baserede systemer skal du starte en systemgenstart for at muliggøre automatisk POST-pakkereparation (PPR). til gendannelse af DIMM-modulet.
- Forbedringer i BIOS-firmware gør det muligt for PPR at gendanne DIMM-fejl, der kan rettes og ikke kan rettes (reference)
- Sammenlign den aktuelle systemtilstand med en automatisk support fra FØR DIMM-fejlen.
- Nyttige DD-CLI-KOMMANDOER (SSH) til kontrol af hukommelse:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Brug DDOS offlinediagnosticering til at teste og fastslå fejl. Gå til Dell Support for at få adgang til Dell EMC Data Domain Operating System 6.x Brugervejledning til Offline Diagnostics Suite
- Hvis det er muligt, skal du udføre fysiske fejlfindingsmetoder for at eliminere og bestemme defekt komponent (ved hjælp af dokumenterede udskiftningsvejledninger og -procedurer).
- Sæt DIMM-modulet ordentligt på plads – sørg for, at begge sider er låst korrekt.
- Skift det med et DIMM-modul, som du ved fungerer, fra en anden slot, kanal, bank eller controller:
- Hvis et system er nede (ingen opstart) på grund af en mistanke om hukommelse-/DIMM-fejl, kan du prøve en minimal opstartsindstilling (fjern eksterne enheder eller kort, og lad 1 x DIMM blive i slot '0')
Additional Information
- Se vidensartikel 130388: PowerProtect- og Data Domain-hardwaredokumenter for at få relevante oplysninger om DIMM-konfiguration og -layout.
- Se relateret videnartikel 82030: Data Domain: Systemhukommelseskrav og udvidede storagekonfigurationer