Data Domain: Minneskort eller DIMM med fel eller defekt

Sammanfattning: Det här dokumentet är till för att hjälpa dig att identifiera felet eller felet och tillhandahålla en lösningsväg.

Den här artikeln gäller för Den här artikeln gäller inte för Den här artikeln är inte kopplad till någon specifik produkt. Alla produktversioner identifieras inte i den här artikeln.

Symptom

Data Domain-system (DD) övervakar status för systemminneshårdvara (DIMM). Om några DIMM-relaterade fel påträffas skickas ett lämpligt varningsmeddelande.

Gäller för:
  • Alla Data Domain-system
  • Alla mjukvaruversioner av Data Domain-operativsystemet (DDOS)
Möjliga varningsmeddelanden upplagda av DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Orsak

DIMM-modulerna som är installerade på Data Domain-system har en felkontrollkod (ECC) som gör att korrigerbara minnesfel kan åtgärdas direkt. Om ett feltröskelvärde överskrids identifierar DDOS felet och en lämplig varning genereras i systemet.

Minnesfel som inte kan korrigeras kan orsaka omstart av systemet och betraktas som ett hårddiskminnesfel. Totalt fel på en enskild DIMM eller minnesexpansionskort kan resultera i ett systemstopp och förhindra att filsystemet aktiveras. Det beror på att DDFS-processen (Data Domain File System) fyller det mesta av det fysiska minnet.

Obs! Andra symptom eller aviseringar kan maskera minnesfel – till exempel CPU-datorkontrollfel – Djupare logganalys och felsökning kan krävas.

Upplösning

Obs! Om ett DIMM-fel rapporteras på Dell PowerEdge-baserade system är den första åtgärden som återställs att starta om DataDomain-enheten. Detta initierar PPR (POST Package Repair) för att återställa DIMM-modulen.

Ansträngningar måste göras för att fastställa orsaken till varningen och identifiera berörda komponent-DIMM, CPU eller moderkort, och byta ut delar vid behov. 

Om det är möjligt ska du samla ihop ett supportpaket och skapa en tjänstebegäran hos din kontrakterade tjänsteleverantör. Följande video visar hur du samlar ihop ett supportpaket: Skaffa ett supportpaketDen här hyperlänken tar dig till en webbplats utanför Dell Technologies.

Riktlinjer för lösning:

  • För Dell PowerEdge-baserade system initierar du en omstart av systemet för att underlätta automatisk POST-Package Repair (PPR). för återställning av DIMM-modulen.
    • Förbättringar i den fasta programvaran för BIOS gör det möjligt för PPR att återställa korrigerbara och icke-korrigerbara DIMM-fel (referens)
  • Jämför aktuellt systemtillstånd med automatisk support INNAN DIMM-felet eller -varningen
  • Användbara DD-CLI-KOMMANDON (SSH) för att kontrollera minnet:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Använd DDOS Offline Diagnostics för att testa och fastställa fel. Gå till Dells support för att få åtkomst till användarhandboken för Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite
  • Utför om möjligt fysiska felsökningsmetoder för att eliminera och fastställa att det är fel på komponenten (med hjälp av dokumenterade utbytesmanualer och procedurer).
  • Sätt tillbaka DIMM-minnet – se till att båda sidorna är ordentligt låsta.
  • Byt ut den mot en fungerande DIMM-modul från en annan kortplats, kanal, bank eller styrenhet:
  • Om ett system ligger nere (startar inte) på grund av ett misstänkt minnes-/DIMM-fel, försök med ett minimalt startalternativ (ta bort kringutrustning eller kort och lämna 1 x DIMM i kortplats "0")

Ytterligare information

Referenser:

Berörda produkter

Data Domain, Integrated Data Protection Appliance Family

Produkter

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Artikelegenskaper
Artikelnummer: 000204330
Artikeltyp: Solution
Senast ändrad: 03 mars 2025
Version:  11
Få svar på dina frågor från andra Dell-användare
Supporttjänster
Kontrollera om din enhet omfattas av supporttjänster.