Data Domain: Troubleshooting von Speicherfehlern
Summary: In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.
Symptoms
In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.
Mögliche Symptome/Warnmeldungen:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- IPMI Watchdog-Neustart
- Warnmeldung zu weniger Arbeitsspeicher als erwartet
- Mögliches Aufhängen beim Einschaltselbsttest (POST)
- System startet nicht oder stürzt ab
Cause
Nicht korrigierbare Arbeitsspeicherfehler können einen Neustart des Systems zur Folge haben und werden als harter Arbeitsspeicherfehler betrachtet.
Der Totalausfall eines einzelnen DIMM oder Speicher-Risers (beherbergt mehrere DIMMs) kann zu einem Systemausfallereignis führen und verhindern, dass das Dateisystem aktiviert wird. Dies liegt daran, dass der DD-Dateisystemprozess (DDFS) den größten Teil des physischen Speichers belegt.
ANMERKUNG: Arbeitsspeicherfehler können durch andere Symptome oder Warnmeldungen maskiert werden, z. B. CPU-Maschinenprüffehler – möglicherweise sind eine umfassendere Protokollanalyse und Fehlerbehebung erforderlich.
Resolution
Das DIMM-Fehlerreporting wird für alle DDOS-Versionen nachverfolgt. Möglicherweise ist jedoch eine Analyse der Systemprotokolle erforderlich, um das spezifische fehlerhafte DIMM zu identifizieren.
Hinweis: Ein DIMM kann sich in einem Speicher-Riser befinden, der an die Hauptplatine angeschlossen ist.
Damit Data Domain Filesystem (DDFS) aktiviert werden kann, muss DER GESAMTE installierte Speicher vorhanden und funktionsfähig sein.
Die Fehlerbehebung kann Folgendes umfassen:
- Offlinediagnose
- Logfile-Analyse
- Neueinsetzen von verdächtigen DIMMs
- Verschieben verdächtiger DIMMs in zweifelsfrei funktionierende Steckplätze (d. h. folgt der Fehler dem DIMM, Steckplatz, Kanal oder Controller?)
- Siehe "Dell Swap-Testleitfaden" Data Domain: Speicherkarte oder DIMM mit Fehler
- Austausch fehlerhafter DIMM oder Riser (nach Bedarf)
- Laufende Überwachung zur Bestätigung der Systemstabilität nach HW-Änderungen oder -Austausch
Hinweis: Wenn Ihr Problem nach Ausführung der Schritte in diesem Wissensdatenbank-Artikel weiterhin besteht, wenden Sie sich an Ihren Supportanbieter oder erstellen Sie einen Service-Request .
Additional Information
Referenzen:
- Informationen zur DIMM-Konfiguration/zum DIMM-Layout
– Data Domain finden Sie in den relevanten DD-Systemhardwarehandbüchern: Systemspeicheranforderungen und erweiterte Speicherkonfigurationen
- Data Domain: Speicherkarte | DIMM ausgefallen, fehlerhaft oder fehlerhaft
– Data Domain: Speicherkarte oder DIMM mit Fehler