Data Domain : Boucle de redémarrage après la mise à niveau du contrôleur : mémoire insuffisante et aucun processus pouvant être supprimé

Summary: Après une mise à niveau du contrôleur, le système continue de redémarrer dans les 5 minutes suivant l’activation du système de fichiers (FS). La cause première est un problème de mémoire insuffisante (OOM), provoquant une panique du noyau. Le système signale un « Mémoire insuffisante » causé par un paramètre de registre non valide. Ce problème peut être résolu en supprimant le système. MEM_HUGETLB=FALSE' et redémarrage du système. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Symptômes :

  • DD continue de redémarrer après la mise à niveau du contrôleur ; Lorsque le système de fichiers (FS) est activé, DD redémarre dans les 5 minutes qui suivent.
    • Désactiver le système de fichiers pour empêcher la boucle de redémarrage (panique du noyau)
  • Des messages de fonctionnement inattendu du noyau sont présents dans les journaux.
  • Des erreurs de mémoire insuffisante sont présentes dans les journaux.
    • En kern.info : 'Kernel panic - not syncing : Mémoire insuffisante et aucun processus pouvant être tué'

Kern.info affiche les erreurs « Mémoire insuffisante » :

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Le système continue de redémarrer après une mise à niveau du contrôleur (par exemple, de DD9300 vers DD9900). Le système de fichiers a été désactivé pour empêcher DD de redémarrer en boucle.
Les journaux du noyau affichent plusieurs erreurs de mémoire insuffisante (OOM), qui déclenchent un fonctionnement inattendu du noyau et des redémarrages ultérieurs.

La cause première du problème est le manque de mémoire disponible pour que le système fonctionne correctement. Cela peut être dû à plusieurs raisons, y compris, mais sans s’y limiter :

  • Une fuite de mémoire dans le logiciel du système
  • Mémoire insuffisante allouée à des processus ou services spécifiques
  • Configuration système incorrecte entraînant une utilisation excessive de la mémoire
  • Problèmes matériels, tels que des modules de mémoire ou d’autres composants défectueux
  • Une clé de registre non valide a peut-être été définie. Le support doit supprimer cette clé. système. MEM_HUGETLB=FALSE.

Un examen plus approfondi est nécessaire pour identifier la cause exacte de l’épuisement de la mémoire et y remédier en conséquence. 

Passez en revue les journaux système et les messages d’erreur afin d’identifier les processus ou services spécifiques susceptibles de consommer une quantité excessive de mémoire et de générer des erreurs de module hors connexion.
En outre, la vérification de l’utilisation et de la configuration de la mémoire du système peut vous aider à identifier les erreurs de configuration ou les problèmes matériels susceptibles d’être à l’origine du problème.
Par exemple: Des barrettes DIMM manquantes ou mal placées peuvent entraîner une configuration non prise en charge ; ce qui empêche le FS de démarrer.

Resolution

  1. Consultez les journaux système pour rechercher tout message d’erreur ou avertissement lié à l’utilisation de la mémoire ou à une mauvaise configuration du système. Traitez-les en conséquence.
  2. Si le problème persiste, contactez le support Dell pour obtenir de l’aide. Veillez à fournir les journaux système ou les informations de diagnostic pertinents pour vous aider à résoudre le problème.
    • Offre groupée de support et boîtiers de base| correspondantsFichiers de vidage du noyau à télécharger

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.