Data Domain: Risoluzione degli errori di memoria
Summary: Questo articolo della Knowledge Base descrive come risolvere gli avvisi relativi alla memoria e come identificare un modulo DIMM difettoso che deve essere sostituito.
Symptoms
Questo articolo della Knowledge Base descrive come risolvere gli avvisi relativi alla memoria e come identificare un modulo DIMM difettoso che deve essere sostituito.
Possibili sintomi/avvisi:
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Riavvio watchdog IPMI
- Avviso di memoria insufficiente rispetto al previsto
- Possibile blocco all'accensione autotest (POST)
- Il sistema non si avvia o il sistema si arresta in modo anomalo
Cause
Gli errori di memoria non correggibili possono causare un riavvio del sistema e sono considerati un errore della memoria rigida.
Il guasto totale di un singolo DIMM o riser di memoria (ospita più DIMM) può causare un evento system down e impedire l'abilitazione del file system. Ciò è dovuto al fatto che il processo DD Filesystem (DDFS) riempie la maggior parte della memoria fisica.
NOTA: Gli errori di memoria possono essere mascherati da altri sintomi o avvisi, ad esempio Errore di controllo del computer CPU - Potrebbe essere necessario eseguire un analisi più approfondita dei registri e la risoluzione dei problemi.
Resolution
La segnalazione degli errori DIMM viene monitorata su tutte le versioni di DDOS. Tuttavia, potrebbe essere necessaria l'analisi dei registri di sistema per identificare lo specifico DIMM guasto.
Nota: Un modulo DIMM può risiedere all'interno di una scheda riser di memoria collegata alla scheda madre.
Affinché Data Domain Filesystem (DDFS) sia abilitato, TUTTA la memoria installata deve essere presente e funzionante.
La risoluzione dei problemi può includere:
- Diagnostica offline
- Analisi dei file di log
- Riposizionare i DIMM sospetti
- Spostamento di DIMM sospetti in slot "funzionanti" (ad es. il guasto segue il DIMM, lo slot, il canale o il controller?)
- Consultare la "Guida ai test di swap Dell" Data Domain: scheda di memoria o DIMM con errore o guasto
- Sostituzione del modulo DIMM o del riser guasto (a seconda dei casi)
- Monitoraggio continuo per confermare la stabilità del sistema dopo modifiche o sostituzioni HW
Nota: Se il problema persiste dopo l'esecuzione della procedura descritta in questo articolo della Knowledge Base, contattare il provider di supporto o creare una Service Request .
Additional Information
Referenze:
- Vedere le guide hardware del sistema DD pertinenti per la configurazione/layout
DIMM - Data Domain: Requisiti di memoria di sistema e configurazioni di
storage espanso- Dominio dei dati: Scheda di memoria | DIMM non riuscito, errore o difettoso
- Data Domain: scheda di memoria o DIMM con errore o guasto