PowerEdge: Linee guida per la risoluzione dei problemi di memoria
Summary:Questo articolo fornisce la procedura consigliata per la risoluzione dei problemi relativi alla memoria sui server Dell PowerEdge.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Il server potrebbe segnalare eventi di memoria come (ma non solo):
MEM0802
MEM6102
MEM6101
MEM5100
MEM5104
UEFI0103 - Errore di inizializzazione della memoria sullo slot:
MEM6101 - Avviso di diagnostica nel dispositivo di memoria durante Controllare la configurazione del dispositivo e del sistema. (ID esteso: )
MEM0001 - Evento non correggibile utilizzato; potrebbe causare il riavvio del server se il sistema operativo non è in grado di ripristinarsi.
MEM9072 - Patrol Scrub ha trovato un errore non correggibile (non utilizzato); nessun impatto a meno che il sistema operativo non utilizzi la memoria.
MEM6104 - Errore irreversibile; I byte estesi mostrano se l'indirizzo è stato utilizzato o identificato dal patrol scrub.
Procedura di risoluzione dei problemi iniziale
La maggior parte dei problemi di cui sopra viene risolta o diagnosticata in modo accurato aggiornando il firmware di componenti specifici. Gli aggiornamenti del firmware contengono correzioni per problemi noti e miglioramenti, il che li rende un primo passo fondamentale verso la risoluzione.
Aggiornare il firmware dei seguenti componenti:
CPLD
iDRAC
BIOS
Nota: Se il firmware CPLD non è disponibile per il modello di server, non si tratta di un problema; procedere con il resto degli aggiornamenti
Procedura avanzata per la risoluzione dei problemi
Una volta completati i passaggi iniziali, il problema potrebbe essere risolto o potrebbe essere necessaria un'ulteriore risoluzione dei problemi, a seconda delle informazioni contenute nei registri TSR, per identificare il componente difettoso.
Dopo aver esaminato i registri TSR, potrebbero essere identificati i seguenti messaggi di errore:
Eventi di memoria a bit singolo (memoria danneggiata) trovati nei registri:
Spegnere il sistema, scollegare l'alimentazione, tenere premuto il pulsante di accensione per 10 secondi per rimuovere tutta l'alimentazione residua
Indossare dispositivi di protezione ESD (scariche elettrostatiche)
Rimuovere il modulo DIMM segnalato
Scambiare il modulo DIMM in un altro slot con un modulo DIMM funzionante
Chiuderlo e ricollegarlo all'alimentazione
Accendi
Riavviare due volte (POST > OS > restart > POST > OS > restart)
Raccogliere un nuovo TSR e verificare nuovamente la presenza di eventi di memoria
Eventi di memoria multibit (memoria guasta) trovati nei registri:
Spegnere il sistema, scollegare l'alimentazione, tenere premuto il pulsante di accensione per 10 secondi per rimuovere tutta l'alimentazione residua
Indossare dispositivi di protezione ESD (scariche elettrostatiche)
Rimuovere il modulo DIMM segnalato
Verificare che la macchina sia in una configurazione di memoria supportata, in caso contrario, rimuovere i DIMM aggiuntivi fino a raggiungere una configurazione supportata
Chiuderlo e ricollegarlo all'alimentazione
Accendi
Raccogliere un nuovo TSR e verificare nuovamente la presenza di eventi di memoria
A seconda del risultato della procedura avanzata di risoluzione dei problemi, è necessario sostituire una parte del modulo di memoria DIMM, se l'evento di memoria ha cambiato slot, o della scheda madre se l'evento di memoria rimane sullo stesso slot.