Data Domain: Minneskort eller DIMM med fel eller defekt
Summary: Det här dokumentet är till för att hjälpa dig att identifiera felet eller felet och tillhandahålla en lösningsväg.
Symptoms
Gäller för:
- Alla Data Domain-system
- Alla mjukvaruversioner av Data Domain-operativsystemet (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
DIMM-modulerna som är installerade på Data Domain-system har en felkontrollkod (ECC) som gör att korrigerbara minnesfel kan åtgärdas direkt. Om ett feltröskelvärde överskrids identifierar DDOS felet och en lämplig varning genereras i systemet.
Minnesfel som inte kan korrigeras kan orsaka omstart av systemet och betraktas som ett hårddiskminnesfel. Totalt fel på en enskild DIMM eller minnesexpansionskort kan resultera i ett systemstopp och förhindra att filsystemet aktiveras. Det beror på att DDFS-processen (Data Domain File System) fyller det mesta av det fysiska minnet.
Resolution
Obs! Om ett DIMM-fel rapporteras på Dell PowerEdge-baserade system är den första åtgärden som återställs att starta om DataDomain-enheten. Detta initierar PPR (POST Package Repair) för att återställa DIMM-modulen.
Ansträngningar måste göras för att fastställa orsaken till varningen och identifiera berörda komponent-DIMM, CPU eller moderkort, och byta ut delar vid behov.
Om det är möjligt ska du samla ihop ett supportpaket och skapa en tjänstebegäran hos din kontrakterade tjänsteleverantör. Följande video visar hur du samlar ihop ett supportpaket: Skaffa ett supportpaket
Riktlinjer för lösning:
- För Dell PowerEdge-baserade system initierar du en omstart av systemet för att underlätta automatisk POST-Package Repair (PPR). för återställning av DIMM-modulen.
- Förbättringar i den fasta programvaran för BIOS gör det möjligt för PPR att återställa korrigerbara och icke-korrigerbara DIMM-fel (referens)
- Jämför aktuellt systemtillstånd med automatisk support INNAN DIMM-felet eller -varningen
- Användbara DD-CLI-KOMMANDON (SSH) för att kontrollera minnet:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Använd DDOS Offline Diagnostics för att testa och fastställa fel. Gå till Dells support för att få åtkomst till användarhandboken för Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite
- Utför om möjligt fysiska felsökningsmetoder för att eliminera och fastställa att det är fel på komponenten (med hjälp av dokumenterade utbytesmanualer och procedurer).
- Sätt tillbaka DIMM-minnet – se till att båda sidorna är ordentligt låsta.
- Byt ut den mot en fungerande DIMM-modul från en annan kortplats, kanal, bank eller styrenhet:
- Om ett system ligger nere (startar inte) på grund av ett misstänkt minnes-/DIMM-fel, försök med ett minimalt startalternativ (ta bort kringutrustning eller kort och lämna 1 x DIMM i kortplats "0")
Additional Information
- Se kunskapsbasartikel 130388: PowerProtect- och Data Domain-hårdvarudokument för relevant information om DIMM-konfiguration och layout.
- Se relaterad kunskapsbasartikel 82030: Data Domain: Systemminneskrav och utökade lagringskonfigurationer