Data Domain: Troubleshooting von Speicherfehlern

Summary: In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

In diesem Wissensdatenbank-Artikel wird beschrieben, wie Sie Speicherwarnungen beheben, einschließlich der Identifizierung eines fehlerhaften DIMM, das ersetzt werden muss.

Mögliche Symptome/Warnmeldungen:
 

DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
  • IPMI Watchdog-Neustart
  • Warnmeldung zu weniger Arbeitsspeicher als erwartet
  • Mögliches Aufhängen beim Einschaltselbsttest (POST)
  • System startet nicht oder stürzt ab

Cause

Die in Datadomain-Systemen installierten DIMMs verfügen über einen "ECC" (Error Checking Code), mit dem korrigierbare Speicherfehler im laufenden Betrieb behoben werden können. Wenn ein Fehlerschwellenwert verletzt wird, meldet DDOS den Fehler und das betroffene DIMM sollte ausgetauscht werden.
Nicht korrigierbare Arbeitsspeicherfehler können einen Neustart des Systems zur Folge haben und werden als harter Arbeitsspeicherfehler betrachtet.
Der Totalausfall eines einzelnen DIMM oder Speicher-Risers (beherbergt mehrere DIMMs) kann zu einem Systemausfallereignis führen und verhindern, dass das Dateisystem aktiviert wird. Dies liegt daran, dass der DD-Dateisystemprozess (DDFS) den größten Teil des physischen Speichers belegt.

ANMERKUNG: Arbeitsspeicherfehler können durch andere Symptome oder Warnmeldungen maskiert werden, z. B. CPU-Maschinenprüffehler – möglicherweise sind eine umfassendere Protokollanalyse und Fehlerbehebung erforderlich.

Resolution

Das DIMM-Fehlerreporting wird für alle DDOS-Versionen nachverfolgt. Möglicherweise ist jedoch eine Analyse der Systemprotokolle erforderlich, um das spezifische fehlerhafte DIMM zu identifizieren.
Hinweis: Ein DIMM kann sich in einem Speicher-Riser befinden, der an die Hauptplatine angeschlossen ist.
         Damit Data Domain Filesystem (DDFS) aktiviert werden kann, muss DER GESAMTE installierte Speicher vorhanden und funktionsfähig sein.

Die Fehlerbehebung kann Folgendes umfassen:

  • Offlinediagnose  
  • Logfile-Analyse
  • Neueinsetzen von verdächtigen DIMMs
  • Verschieben verdächtiger DIMMs in zweifelsfrei funktionierende Steckplätze (d. h. folgt der Fehler dem DIMM, Steckplatz, Kanal oder Controller?)
  • Austausch fehlerhafter DIMM oder Riser (nach Bedarf)  
  • Laufende Überwachung zur Bestätigung der Systemstabilität nach HW-Änderungen oder -Austausch

Hinweis: Wenn Ihr Problem nach Ausführung der Schritte in diesem Wissensdatenbank-Artikel weiterhin besteht, wenden Sie sich an Ihren Supportanbieter oder erstellen Sie einen Service-Request .

Additional Information

Affected Products

Data Domain, PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000034334
Article Type: Solution
Last Modified: 05 Aug 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.