Data Domain: Troubleshooting von Speicherfehlern

Zusammenfassung: In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.

Mögliche Symptome/Warnmeldungen:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • IPMI Watchdog-Neustart
  • Warnmeldung zu weniger Arbeitsspeicher als erwartet
  • Mögliches Aufhängen beim Einschaltselbsttest (POST)
  • System startet nicht oder stürzt ab

Ursache

Die in Datadomain-Systemen installierten DIMMs verfügen über einen "ECC" (Error Checking Code), mit dem korrigierbare Speicherfehler im laufenden Betrieb behoben werden können. Wenn ein Fehlerschwellenwert verletzt wird, meldet DDOS den Fehler und das betroffene DIMM sollte ausgetauscht werden.
Nicht korrigierbare Arbeitsspeicherfehler können einen Neustart des Systems zur Folge haben und werden als harter Arbeitsspeicherfehler betrachtet.
Der Totalausfall eines einzelnen DIMM oder Speicher-Risers (beherbergt mehrere DIMMs) kann zu einem Systemausfallereignis führen und verhindern, dass das Dateisystem aktiviert wird. Dies liegt daran, dass der DD-Dateisystemprozess (DDFS) den größten Teil des physischen Speichers belegt.

ANMERKUNG: Arbeitsspeicherfehler können durch andere Symptome oder Warnmeldungen maskiert werden, z. B. CPU-Maschinenprüffehler – möglicherweise sind eine umfassendere Protokollanalyse und Fehlerbehebung erforderlich.

Lösung

Das DIMM-Fehlerreporting wird für alle DDOS-Versionen nachverfolgt. Möglicherweise ist jedoch eine Analyse der Systemprotokolle erforderlich, um das spezifische fehlerhafte DIMM zu identifizieren.
Hinweis: Ein DIMM kann sich in einem Speicher-Riser befinden, der an die Hauptplatine angeschlossen ist.
         Damit Data Domain Filesystem (DDFS) aktiviert werden kann, muss DER GESAMTE installierte Speicher vorhanden und funktionsfähig sein.

Die Fehlerbehebung kann Folgendes umfassen:

  • Offlinediagnose  
  • Logfile-Analyse
  • Neueinsetzen von verdächtigen DIMMs
  • Verschieben verdächtiger DIMMs in zweifelsfrei funktionierende Steckplätze (d. h. folgt der Fehler dem DIMM, Steckplatz, Kanal oder Controller?)
  • Austausch fehlerhafter DIMM oder Riser (nach Bedarf)  
  • Laufende Überwachung zur Bestätigung der Systemstabilität nach HW-Änderungen oder -Austausch

Hinweis: Wenn Ihr Problem nach Ausführung der Schritte in diesem Wissensdatenbank-Artikel weiterhin besteht, wenden Sie sich an Ihren Supportanbieter oder erstellen Sie einen Service-Request .

Weitere Informationen

Betroffene Produkte

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Artikeleigenschaften
Artikelnummer: 000034334
Artikeltyp: Solution
Zuletzt geändert: 17 Apr. 2026
Version:  8
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.