PowerEdge : Consignes de dépannage des problèmes de mémoire
Summary: Cet article fournit les étapes recommandées pour vous aider à résoudre les événements liés à la mémoire sur les serveurs Dell PowerEdge.
Instructions
Codes d’événements de mémoire courants
Votre serveur peut signaler des événements de mémoire tels que (mais sans s’y limiter) :
- MEM0802
- MEM6102
- MEM6101
- MEM5100
- MEM5104
- UEFI0103 - Memory initialization error on slot :
- MEM6101 : avertissement de diagnostic dans le périphérique de mémoire sous Vérifiez la configuration de l’appareil et du système. (ID étendu : )
- MEM0001 - Événement non corrigible consommé ; peut entraîner un redémarrage du serveur si le système d’exploitation ne parvient pas à récupérer.
- MEM9072 - Erreur non corrigible trouvée par le nettoyage de la patrouille (non consommée) ; pas d’impact à moins que le système d’exploitation n’utilise la mémoire.
- MEM6104 - Erreur non corrigible ; Les octets étendus indiquent si l’adresse a été utilisée ou identifiée par le nettoyage de la surveillance.
Étapes initiales de dépannage
La plupart des problèmes ci-dessus sont résolus ou diagnostiqués avec précision par la mise à jour du firmware de composants spécifiques. Les mises à jour de firmware contiennent des correctifs pour les problèmes connus et des améliorations. Elles constituent donc une première étape essentielle vers la résolution.
- Mettez à jour le firmware des composants suivants :
- CPLD
- iDRAC
- BIOS
Remarque : Si le firmware CPLD n’est pas disponible pour le modèle de serveur, ce n’est pas un problème. Poursuivez avec le reste des mises à jourMode d’emploi : Suivez les étapes décrites dans PowerEdge : Mise à jour du firmware pour chaque composant important - Effacez le journal des événements système (SEL) en suivant les étapes décrites dans l’article ci-dessous.
- Effectuez deux redémarrages complets du serveur.
- Collectez un journal de support (TSR) et vérifiez si des événements de mémoire sont signalés (PowerEdge : Exporter une collecte SupportAssist à l’aide d’un iDRAC)
Étapes de dépannage avancées
Une fois les étapes initiales terminées, le problème peut être résolu ou un dépannage supplémentaire peut être nécessaire, en fonction des informations contenues dans les journaux TSR, afin d’identifier le composant défectueux.
Lors de l’examen des journaux TSR, les messages d’erreur suivants peuvent être identifiés :
- Événements de mémoire sur un seul bit (mémoire dégradée) trouvés dans les journaux :
- Mettez le système hors tension, débranchez l’alimentation, appuyez sur le bouton d’alimentation et maintenez-le enfoncé pendant 10 secondes pour éliminer toute électricité résiduelle.
- Porter un équipement de protection contre les décharges électrostatiques (ESD)
- Retirez la barrette DIMM signalée.
- Remplacez le module DIMM dans un autre logement par un module DIMM dont le fonctionnement a été vérifié
- Fermez-le et rebranchez-le sur le secteur.
- Allumez-le
- Redémarrez-le deux fois (redémarrage du système d’exploitation, redémarrage >> du système d’exploitation > POST>)>
- Collecter un nouveau TSR et rechercher à nouveau les événements de mémoire
- Événements de mémoire multibits (mémoire défaillante) trouvés dans les journaux :
- Mettez le système hors tension, débranchez l’alimentation, appuyez sur le bouton d’alimentation et maintenez-le enfoncé pendant 10 secondes pour éliminer toute électricité résiduelle.
- Porter un équipement de protection contre les décharges électrostatiques (ESD)
- Retirez la barrette DIMM signalée.
- Vérifiez si la machine est dans une configuration de mémoire prise en charge. Sinon, retirez les modules DIMM supplémentaires jusqu’à ce qu’une configuration prise en charge soit atteinte
- Fermez-le et rebranchez-le sur le secteur.
- Allumez-le
- Collecter un nouveau TSR et rechercher à nouveau les événements de mémoire
En fonction du résultat des étapes de dépannage avancées, une pièce de rechange est nécessaire pour la mémoire DIMM, si l’événement de mémoire a changé de logement, ou pour la carte mère si l’événement de mémoire reste sur le même logement.