Data Domain. Цикл перезагрузки после модернизации контроллера — недостаточно памяти и нет прекращаемых процессов

Summary: После модернизации контроллера система продолжает перезагружаться в течение 5 минут после включения файловой системы (FS). Корневая причина — состояние нехватки памяти (OOM), вызывающее критическую ошибку ядра. Система сообщает о нехватке памяти из-за неправильного параметра реестра. Эту проблему можно устранить, удалив «system. MEM_HUGETLB=FALSE' и перезагрузите систему. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Признаки:

  • DD продолжает перезагружаться после обновления контроллера; если файловая система (файловая система (файловая система) включена, DD перезагружается в течение 5 минут.
    • Отключите файловую систему, чтобы предотвратить циклическую перезагрузку (критическая ошибка ядра)
  • Сообщения о критической ошибке ядра присутствуют в журналах.
  • Ошибки нехватки памяти присутствуют в журналах.
    • В kern.info: 'Kernel panic - not syncing: Нехватка памяти и отсутствие убиваемых процессов'

Kern.info отображает ошибки нехватки памяти:

Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child
Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child
Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child
Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child

Cause

Система продолжит перезагружаться после модернизации контроллера (например, с DD9300 до DD9900). Файловая система была отключена, чтобы предотвратить циклическую перезагрузку DD.
В журналах ядра отображается несколько ошибок нехватки памяти (OOM), которые вызывают критическую ошибку ядра и последующие перезагрузки.

Основная причина проблемы — нехватка памяти для правильной работы системы. Это может быть вызвано несколькими причинами, включая, но не ограничиваясь:

  • Утечка памяти в системном ПО
  • Недостаточно памяти, выделенной для определенных процессов или служб
  • Неправильная конфигурация системы, приводящая к чрезмерному использованию памяти
  • Проблемы с оборудованием, такие как неисправные модули памяти или другие компоненты
  • Возможно, был задан недопустимый раздел реестра. Этот раздел должен быть удален службой поддержки. система. MEM_HUGETLB=ЛОЖЬ.

Требуется дальнейшее исследование, чтобы определить точную причину истощения памяти и устранить ее соответствующим образом. 

Просмотрите системные журналы и сообщения об ошибках, чтобы определить конкретные процессы или службы, которые могут потреблять слишком много памяти и вызывать ошибки OOM.
Кроме того, проверка использования и конфигурации системной памяти может помочь выявить любые ошибки в конфигурациях или проблемы с оборудованием, которые могут привести к возникновению проблемы.
Например: Отсутствующие или неправильно размещенные модули DIMM могут привести к неподдерживаемой конфигурации; что предотвратит запуск файловой системы.

Resolution

  1. Проверьте системные журналы на наличие сообщений об ошибках или предупреждений, связанных с использованием памяти или неправильной конфигурацией системы. Решайте их соответствующим образом.
  2. Если проблема не будет устранена, обратитесь в службу поддержки Dell для получения дополнительной помощи. Обязательно предоставьте соответствующие системные журналы или диагностическую информацию, которая поможет в устранении проблемы.
    • Support Bundle и соответствующий пакет Core|Файлы дампа ядра для загрузки

Affected Products

Data Domain

Products

Data Protection
Article Properties
Article Number: 000228075
Article Type: Solution
Last Modified: 01 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.