Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

How to troubleshoot memory or battery errors on the PERC controller on Dell PowerEdge servers

Summary: Vous trouverez ici des informations détaillées relatives à la résolution des problèmes de mémoire et de batterie sur les contrôleurs RAID PowerEdge (PERC) utilisés avec les serveurs Dell. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Cet article fournit des informations sur le dépannage de l’erreur « Memory/battery problems were detected. The adapter has recovered, but cached data was lost. Press any key to continue » (Problèmes de mémoire/batterie détectés. L’adaptateur a récupéré mais les données en mémoire cache ont été perdues. Appuyez sur une touche pour continuer.) et sur d’autres erreurs de mémoire pouvant se produire avec le contrôleur PERC Dell sur les serveurs Dell PowerEdge.
 

Sommaire :

  1. Message d’erreur relatif au contrôleur RAID pendant l’autotest de démarrage
  2. Conditions de dépannage qui conduisent à ce message d’erreur
    1. Redémarrage du système d’exploitation
    2. Nettoyage du cache du contrôleur
    3. Vérification du contrôleur PERC physique
  3. Informations supplémentaires
    1. Maintenance de la batterie PERC
    2. Utilisation de la mémoire cache 
       

1. Message d’erreur relatif au contrôleur RAID pendant l’autotest de démarrage

Pendant l’autotest de démarrage (POST), le contrôleur RAID affiche un message :

Memory/battery problems were detected. The adapter has recovered but cache data may be lost. Appuyez sur n’importe quelle touche pour continuer.

Pour les erreurs qui s’affichent sur l’écran LCD ou lors de l’exécution des tests de diagnostic, reportez-vous à l’article suivant :

Interprétation des messages d’événements écran LCD et diagnostics intégrés (ePSA). (En anglais) 

Retour au début
 


2. Conditions de dépannage qui conduisent à ce message d’erreur

Ce message peut survenir normalement lorsque l’une des conditions suivantes se produit. Le dépannage des événements associés empêcheront également sans doute l'affichage de ce message.

  • Le système d’exploitation signale un arrêt anormal.
  • Le système d’exploitation signale qu’une erreur s’est produite (un écran bleu est survenu dans Windows).
  • Condition de perte d’alimentation spontanée.

Les étapes de dépannage les plus courantes sont les suivantes :
 

1. Redémarrage du système d’exploitation

Si le système d’exploitation redémarre correctement, un nouveau redémarrage devrait empêcher tout message de s’afficher.

2. Nettoyage du cache du contrôleur

  1. CTRL+M pour les contrôleurs SCSI (PERC 3, PERC 4).
  2. CTRL+R pour que les contrôleurs SAS/SATA (PERC 5, PERC 6 et contrôleurs plus récents).
  3. Patientez cinq minutes pour permettre au contenu du cache de s’effacer.
  4. Relancez le BIOS du contrôleur.
    Remarque : si l’erreur persiste, la probabilité d’une erreur matérielle augmente. Veuillez contacter le support technique pour obtenir des opérations de dépannage supplémentaires.
  5. Si l’erreur est résolue, démarrez à partir du système d’exploitation.
  6. Si le démarrage du système d'exploitation ne réussit pas et/ou si l'erreur persiste, il s'agit peut-être d'un problème lié au système d'exploitation. Veuillez contacter le support technique afin d’obtenir des étapes de dépannage supplémentaires si vous disposez d’une garantie active.

Retour au début
 

3. Vérification du contrôleur PERC physique

 

  1. Vérifiez que le module de mémoire DIMM et le support DIMM ne sont pas endommagés.
    1. Mettez le système hors tension et débranchez le(s) câble(s) d’alimentation du système.
    2. Laissez le système dans cet état pendant 30 secondes pour que l’électricité résiduelle se décharge.
    3. Retirez le contrôleur PERC. Pour plus d’informations sur le retrait et le remplacement de pièces sur le système, reportez-vous au Guide de l’utilisateur disponible sur le site de support technique Dell.
    4. Retirez la batterie de la mémoire RAID. N’oubliez pas de réinstaller la batterie de la mémoire après avoir inséré le module de mémoire DIMM.
    5. Retirez le module de mémoire DIMM du contrôleur (le cas échéant).
    6. Vérifiez que les broches du support DIMM ne sont pas pliées ou endommagées. Vérifiez que le connecteur latéral du module de mémoire DIMM est intact.
  2. Si le contrôleur a une mémoire intégrée ou si le socket de mémoire est endommagé, le contrôleur PERC doit être remplacé.
  3. Si la mémoire est endommagée, la mémoire du contrôleur doit être remplacée.
  4. Si aucun composant n’est endommagé, remplacez le module de mémoire DIMM et réinstallez le contrôleur.
  5. Remplacez la mémoire du contrôleur par une mémoire dont le fonctionnement a été vérifié (si possible).
    1. Aucune mémoire dont le fonctionnement a été vérifié n’est disponible : contactez le support.
    2. L’erreur ne se produit pas avec le module de mémoire dont le fonctionnement a été vérifié : remplacez le module de mémoire.
    3. L’erreur persiste avec le module de mémoire dont le fonctionnement a été vérifié : remplacez le contrôleur PERC.
 

Retour au début



3. Informations supplémentaires


Le message d’erreur qui s’affiche pendant l’autotest de démarrage indique que la mémoire cache du contrôleur ne contient pas toutes les informations prévues ou qu’elle contient des données destinées à un disque dur qui ne peuvent pas être ou qui n’ont pas été écrites sur le disque dur. Les raisons les plus courantes de cette erreur sont les suivantes :
 

  • Le serveur n’a pas effectué une procédure d’arrêt normale : une coupure d’alimentation et/ou un redémarrage spontané peuvent entraîner des données incomplètes ou altérées dans le cache qui ne peuvent pas être écrites sur un disque dur.
  • La mémoire cache est défectueuse : une mauvaise mémoire cache peut engendrer l’altération de données. Cela peut provoquer des problèmes liés au système d’exploitation et des redémarrages spontanés.
  • Perte d’alimentation de la batterie pendant l’arrêt du serveur : les contrôleurs qui n’utilisent pas la mémoire NVCACHE (cache non volatile) utilisent des batteries qui peuvent conserver le contenu de la mémoire cache pour une durée limitée (24 à 72 heures) lorsque le serveur n’est pas sous tension. Une fois la batterie vide, le contenu entier de la mémoire cache est perdue et le contrôleur reconnaît que la mémoire cache ne contient pas toutes les informations prévues. Les contrôleurs qui utilisent la mémoire NVCache (certains contrôleurs H700/H800 et des contrôleurs plus récents, tels que les contrôleurs H710, H710P, H810) ne rencontreront probablement pas ce problème étant donné que la batterie ne doit assurer l’alimentation que pendant 30 secondes ou moins dans la plupart des cas.


Retour au début

1. Maintenance de la batterie PERC


Si vous pensez qu’une batterie PERC est en panne ou si un symbole d’avertissement s’affiche dans OpenManage Server Administrator (OMSA), vous devez effectuer un cycle d’apprentissage manuel.  Un cycle d'apprentissage provoque le déchargement et le rechargement de la batterie, et devrait restaurer la batterie à un état entièrement fonctionnel. Dans certains cas, plusieurs procédures de cycle d'apprentissage peuvent être nécessaires pour restaurer la batterie à un état de charge efficace. Pour effectuer un cycle d’apprentissage manuel, sélectionnez Start Learn Cycle depuis le menu déroulant Battery Tasks dans OMSA.

SLN130018_en_US__1I_PERC_Battery_JM_V1
Figure 1 : Menu déroulant Battery Tasks dans OMSA

Retour au début

2. Utilisation de la mémoire cache

Les contrôleurs RAID matériels utilisent le cache (un espace temporaire d'informations) pour le fonctionnement normal. Le cache de fonctionnement normal est composé d’une mémoire DRAM qui, comme la mémoire système, conserve les données uniquement lorsqu’il est sous tension.

Les nouveaux contrôleurs utilisent la mémoire NVCache, utilisée lorsque le serveur est hors tension. La mémoire NVCache contient les deux emplacements de modules de mémoire DRAM (pour le fonctionnement normal) et la mémoire flash (non volatile). La batterie des contrôleurs (si opérationnelle) alimente la mémoire DRAM lors d’une coupure de courant afin que le contenu puisse être copié dans la mémoire flash pour un stockage indéfini.
 

Le contenu de la mémoire cache peut être divisé en trois parties :
  1. Configuration et métadonnées RAID : informations sur les matrices RAID, y compris des informations sur la configuration, les disques membres, le rôle des disques, etc.
  2. Fichiers journaux des contrôleurs : les contrôleurs RAID conservent plusieurs fichiers journaux. Les techniciens Dell s’appuient sur le fichier journal TTY comme fichier journal principal pour le dépannage de divers problèmes liés aux matrices RAID et au disque dur.
  3. Données RAID : il s'agit des données destinées à être écrites sur les différents disques durs. Les données sont écrites dans la mémoire cache du contrôleur dans les modes de stratégie de cache Écriture et Écriture conditionnelle.


Retour au début


Cause

-

Resolution

-

Article Properties


Affected Product

PowerEdge, OEMR R720xd

Last Published Date

25 Mar 2022

Version

6

Article Type

Solution