Домен даних: Цикл перезавантаження після оновлення контролера - бракує пам'яті та немає вбиваних процесів

Summary: Після оновлення контролера система продовжує перезавантажуватися протягом 5 хвилин після ввімкнення файлової системи (FS). Основною причиною є стан нестачі пам'яті (OOM), що викликає паніку в ядрі. Система повідомляє про нестачу пам'яті, спричинену неправильним налаштуванням реєстру. Цю проблему можна вирішити, видаливши поле «система. MEM_HUGETLB=FALSE' і перезавантаження системи. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Симптоми:

  • DD продовжує перезавантажуватися після оновлення контролера; коли файлова система (FS) увімкнена, DD перезавантажується протягом 5 хвилин.
    • Вимкніть FS, щоб запобігти циклу перезавантаження (Kernel Panic)
  • Повідомлення Kernel Panic присутні в журналах.
  • У логах присутні помилки Out of Memory.
    • У kern.info: 'Паніка ядра - не синхронізується: Бракує пам'яті і немає вбиваних процесів»

Kern.info показує помилки "Бракує пам'яті":

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Система продовжує перезавантажуватися після оновлення контролера (наприклад, з DD9300 до DD9900). Файлова система була відключена, щоб запобігти циклічному
перезавантаженню ДД.Журнали ядра показують численні помилки Out of Memory (OOM), які викликають паніку ядра та подальші перезавантаження.

Основною причиною проблеми є недостатність доступної пам'яті для належної роботи системи. Це може бути пов'язано з кількома причинами, включаючи, але не обмежуючись:

  • Витік пам'яті в системному програмному забезпеченні
  • Недостатній обсяг пам'яті, виділеної для конкретних процесів або служб
  • Неправильна конфігурація системи, що призводить до надмірного використання пам'яті
  • Проблеми з обладнанням, наприклад несправні модулі пам'яті або інші компоненти
  • Можливо, був встановлений невірний ключ реєстру, підтримка повинна видалити цей ключ; система. MEM_HUGETLB=БРЕХНЯ.

Потрібне подальше дослідження, щоб визначити точну причину виснаження пам'яті та усунути її відповідним чином. 

Перегляньте системні журнали та повідомлення про помилки, щоб виявити будь-які конкретні процеси або служби, які можуть споживати забагато пам'яті та спричиняти помилки OOM.
Крім того, перевірка використання та конфігурації пам'яті системи може допомогти виявити будь-які неправильні конфігурації або проблеми з обладнанням, які можуть сприяти виникненню проблеми.
Наприклад: Відсутні або неправильно розміщені модулі DIMM можуть призвести до непідтримуваної конфігурації; що перешкоджає запуску ФС.

Resolution

  1. Перевірте системні журнали на наявність повідомлень про помилки або попереджень, пов'язаних із використанням пам'яті або неправильною конфігурацією системи; Розгляньте їх відповідно.
  2. Якщо проблема не зникає, зверніться до служби підтримки Dell за додатковою допомогою. Обов'язково надайте відповідні системні журнали або діагностичну інформацію, яка допоможе вирішити проблему.
    • Пакет підтримки та відповідне ядро|Файли дампа ядра для завантаження

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.