VxBlock : Dépannage des erreurs de mémoire au sein d’un Cisco UCS

Summary: Cet article explique comment dépanner et résoudre les erreurs de mémoire dans un environnement Cisco Unified Computing System (UCS).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Identification de l’erreur :

  • Passez en revue l’onglet « Faults » dans UCS pour déterminer s’il y a des erreurs et un impact. 
  • Capturez les journaux UCSM et du châssis à partir du serveur concerné AVANT tout dépannage. Cela est nécessaire pour capturer les données historiques afin d’identifier si ces erreurs reviennent après le dépannage. 


Error Confirmation :
Une fois les erreurs identifiées, effacez-les toutes et surveillez les compteurs pour voir si elles persistent. 

  1. Connectez-vous à la ligne de commande UCS.
  2. Réinitialisez les erreurs de mémoire à l’aide des commandes suivantes :

CLI# scope server X/Y
CLI# reset-all-memory-errors
CLI# commit-buffer

  1. Effacez les journaux des événements système à l’aide des commandes suivantes :

CLI# scope server X/Y
CLI# clear sel
CLI# commit-buffer

  1. Réinitialisez CIMC à l’aide des commandes suivantes :

CLI# scope server X/Y
CLI# scope cimc
CLI# reset
CLI# commit-buffer

  1. Surveillez l’environnement pendant 48 heures. 
Si les erreurs de mémoire persistent, capturez un nouvel ensemble de journaux UCSM et de châssis, puis passez à la section suivante. 


Dépannage physique :
Avant de pouvoir remplacer un module DIMM, déterminez si les erreurs sont liées au socket, au DIMM ou au processeur.

Cette opération s’effectue en échangeant les composants matériels et en surveillant l’environnement. Les instructions sont fournies ci-dessous :
  1. Mettez l’hôte ESXi en mode maintenance. 
  2. Les barrettes DIMM défectueuses doivent être remplacées par des barrettes DIMM qui ne présentaient aucun problème auparavant.
  3. Le serveur doit être redémarré et rester en mode maintenance.
  4. Le serveur peut être surveillé pendant 48 heures pour voir si le problème se présente à nouveau.

Si vous ne parvenez pas à réinstaller les composants, contactez le support Dell ou faites appel à des ressources supplémentaires pour obtenir de l’aide.  

Si les erreurs persistent après les réinstallations, procédez comme suit :

  • En cas d’erreurs DIMM, suivez le DIMM vers un nouveau logement et remplacez-le. 
  • Si les erreurs DIMM restent avec le même logement DIMM, remplacez la carte mère.
  • Si les erreurs de DIMM persistent après le remplacement du module DIMM et de la carte mère, lancez un WebEx pour un dépannage en direct avec le support Dell.  

Additional Information

Regardez cette vidéo :

Affected Products

Converged Infrastructure
Article Properties
Article Number: 000194121
Article Type: How To
Last Modified: 19 Nov 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.