Data Domain : résolution des erreurs de mémoire (en anglais)
Summary: Cet article de la base de connaissances explique comment résoudre les problèmes liés aux alertes de mémoire, notamment comment identifier une barrette DIMM défectueuse qui doit être remplacée. ...
Symptoms
Cet article de la base de connaissances explique comment résoudre les problèmes liés aux alertes de mémoire, notamment comment identifier une barrette DIMM défectueuse qui doit être remplacée.
Symptômes/alertes possibles :
DIMM-00001: Correctable ECC logging limit reached DIMM-00002: Multibit Uncorrectable ECC error DIMM-00003: A memory card has failed ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold ENVIRONMENT-00013: Memory uncorrectable ECC error alert. ENVIRONMENT-00044: Memory riser fault has been detected MEM-00001: DIMM failure detected after install. DDFS ""will not be started. MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
*These may also be reported without the hyphen (-): e.g.
DIMM00001, DIMM00002, DIMM00003, ENVIRONMENT00009, ENVIRONMENT00013, ENVIRONMENT00044, MEM00001, MEM00002
- Redémarrage de la surveillance IPMI
- Alerte Moins de mémoire que prévu
- Blocage possible lors de l’autotest de démarrage (POST)
- Le système ne démarre pas ou le système tombe en panne
Cause
Les erreurs de mémoire non corrigibles peuvent entraîner un redémarrage du système et sont considérées comme une défaillance de la mémoire matérielle.
La défaillance totale d’un seul module DIMM ou d’une carte de montage de mémoire (hébergeant plusieurs modules DIMM) peut entraîner un événement d’arrêt du système et empêcher l’activation du système de fichiers. Cela est dû au fait que le processus DD Filesystem (DDFS) mobilise la majeure partie de la mémoire physique.
NOTE: Les erreurs de mémoire peuvent être masquées par d’autres symptômes ou alertes, par exemple, une erreur de vérification de la machine du processeur. Une analyse approfondie des journaux et un dépannage peuvent être nécessaires.
Resolution
Les rapports d’erreurs DIMM font l’objet d’un suivi sur toutes les versions DDOS. Toutefois, l’analyse des journaux système peut être nécessaire pour identifier le module DIMM spécifique en cause.
Remarque : Un module DIMM peut résider dans une carte de montage de mémoire reliée à la carte mère.
Pour que le système de fichiers Data Domain (DDFS) soit activé, TOUTE la mémoire installée doit être présente et fonctionnelle.
Le dépannage peut inclure :
- Diagnostics hors ligne
- Analyse des fichiers journaux
- Replacement des barrettes DIMM suspectes
- Déplacement des barrettes DIMM suspectes vers des logements dont le fonctionnement a été vérifié (c’est-à-dire que la panne provient de la barrette DIMM, du logement, du canal ou du contrôleur ?)
- Voir le « Dell Swap Testing Guide », Data Domain : Carte mémoire ou module DIMM avec une erreur de défaillance ou de composant défectueux
- Remplacement d’une barrette DIMM ou d’une carte de montage défaillante (le cas échéant)
- Surveillance continue pour confirmer la stabilité du système après les modifications ou le remplacement du matériel
Remarque : Si votre problème persiste après l’exécution des étapes décrites dans cet article de la base de connaissances, contactez votre fournisseur de support ou créez une demande de service .
Additional Information
Références:
- Reportez-vous aux guides matériels des systèmes DD pertinents pour la configuration/disposition
des modules DIMM - Data Domain : Exigences en matière de mémoire système et configurations
de stockage étendu- Data Domain : Carte mémoire | DIMM Failed,error or faulty
- Data Domain : Carte mémoire ou module DIMM avec une erreur de défaillance ou de composant défectueux