Домен даних: Цикл перезавантаження після оновлення контролера - бракує пам'яті та немає вбиваних процесів
Summary: Після оновлення контролера система продовжує перезавантажуватися протягом 5 хвилин після ввімкнення файлової системи (FS). Основною причиною є стан нестачі пам'яті (OOM), що викликає паніку в ядрі. Система повідомляє про нестачу пам'яті, спричинену неправильним налаштуванням реєстру. Цю проблему можна вирішити, видаливши поле «система. MEM_HUGETLB=FALSE' і перезавантаження системи. ...
Symptoms
Симптоми:
- DD продовжує перезавантажуватися після оновлення контролера; коли файлова система (FS) увімкнена, DD перезавантажується протягом 5 хвилин.
- Вимкніть FS, щоб запобігти циклу перезавантаження (Kernel Panic)
- Повідомлення Kernel Panic присутні в журналах.
- У логах присутні помилки Out of Memory.
- У kern.info: 'Паніка ядра - не синхронізується: Бракує пам'яті і немає вбиваних процесів»
Kern.info показує помилки "Бракує пам'яті":
Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child
Cause
Система продовжує перезавантажуватися після оновлення контролера (наприклад, з DD9300 до DD9900). Файлова система була відключена, щоб запобігти циклічному
перезавантаженню ДД.Журнали ядра показують численні помилки Out of Memory (OOM), які викликають паніку ядра та подальші перезавантаження.
Основною причиною проблеми є недостатність доступної пам'яті для належної роботи системи. Це може бути пов'язано з кількома причинами, включаючи, але не обмежуючись:
- Витік пам'яті в системному програмному забезпеченні
- Недостатній обсяг пам'яті, виділеної для конкретних процесів або служб
- Неправильна конфігурація системи, що призводить до надмірного використання пам'яті
- Проблеми з обладнанням, наприклад несправні модулі пам'яті або інші компоненти
- Можливо, був встановлений невірний ключ реєстру, підтримка повинна видалити цей ключ; система. MEM_HUGETLB=БРЕХНЯ.
Потрібне подальше дослідження, щоб визначити точну причину виснаження пам'яті та усунути її відповідним чином.
Перегляньте системні журнали та повідомлення про помилки, щоб виявити будь-які конкретні процеси або служби, які можуть споживати забагато пам'яті та спричиняти помилки OOM.
Крім того, перевірка використання та конфігурації пам'яті системи може допомогти виявити будь-які неправильні конфігурації або проблеми з обладнанням, які можуть сприяти виникненню проблеми.
Наприклад: Відсутні або неправильно розміщені модулі DIMM можуть призвести до непідтримуваної конфігурації; що перешкоджає запуску ФС.
Resolution
- Перевірте системні журнали на наявність повідомлень про помилки або попереджень, пов'язаних із використанням пам'яті або неправильною конфігурацією системи; Розгляньте їх відповідно.
- Якщо проблема не зникає, зверніться до служби підтримки Dell за додатковою допомогою. Обов'язково надайте відповідні системні журнали або діагностичну інформацію, яка допоможе вирішити проблему.
- Пакет підтримки та відповідне ядро|Файли дампа ядра для завантаження