Avamar ADS Gen5 : Event code=52804 A memory device error occurred
Summary: Event code=52804, A memory device error occurred
Symptoms
Un message similaire à celui-ci peut s’afficher dans l’affichage des événements MCCLI, sur la page des événements de l’interface utilisateur Avamar (AUI) ou dans /var/log/messages :
EventID: 52804 A memory device error occurred. The system may continue to function as normal (except for a multibit error). Replace the memory module identified in the message during the system's next scheduled maintenance. Clear the memory error on multibit ECC error. The memory device status and location are provided
Cause
Panne DIMM prédictive
Resolution
Connectez-vous au nœud concerné et exécutez la commande suivante :
Omreport chassis memory
Un logement de mémoire défaillant similaire à ce qui suit peut être renvoyé :
Index : 3 Status : Critical Connector Name : A4 Type : DDR4 - Synchronous Registered (Buffered) Size : 16384 MB
Exemple de sortie pour un logement de mémoire normal :
Index : 6 Status : Ok Connector Name : B1 Type : DDR4 - Synchronous Registered (Buffered) Size : 16384 MB
Un logement de mémoire inoccupé possède toujours un nom de connecteur. Exemple de sortie pour un logement de mémoire inoccupé :
Index : Status : Unknown Connector Name : A7 Type : [Not Occupied] Size :
Plusieurs codes d’erreur constituent ce code de symptôme. La plupart d’entre eux ne nécessitent aucune action. Les codes d’événements suivants nécessitent une action.
Notez que les codes d’erreur peuvent être désignés par Event Code, MessageID ou Code :
| Code d’erreur | Description | Action recommandée |
| MEM0001 | Des erreurs de mémoire multibits sont détectées sur le périphérique mémoire à l’emplacement arg1. | Remplacez immédiatement la barrette DIMM. |
| MEM0702 | Erreurs de mémoire détectées et corrigées par le système | Redémarrez le système pour activer l’autoréparation potentielle de la mémoire. |
| MEM9072 | La mémoire système présente des erreurs de mémoire multibits non corrigibles dans le chemin d’inexécution d’un périphérique mémoire à l’emplacement arg1. | Remettez immédiatement en place la barrette DIMM. |
MEM0702 |
« Le taux d’erreurs de mémoire corrigibles a été dépassé pendant DIMM_XX. » |
Remettez immédiatement en place la barrette DIMM. |
Si l’action recommandée ci-dessus consiste à remplacer la barrette DIMM, utilisez le Nom du connecteur pour spécifier le logement à remplacer. Il n’est pas nécessaire de remplacer plusieurs logements, comme c’était le cas dans Gen4t.