Data Domain. Цикл перезагрузки после модернизации контроллера — недостаточно памяти и нет прекращаемых процессов
Summary: После модернизации контроллера система продолжает перезагружаться в течение 5 минут после включения файловой системы (FS). Корневая причина — состояние нехватки памяти (OOM), вызывающее критическую ошибку ядра. Система сообщает о нехватке памяти из-за неправильного параметра реестра. Эту проблему можно устранить, удалив «system. MEM_HUGETLB=FALSE' и перезагрузите систему. ...
Symptoms
Признаки:
- DD продолжает перезагружаться после обновления контроллера; если файловая система (файловая система (файловая система) включена, DD перезагружается в течение 5 минут.
- Отключите файловую систему, чтобы предотвратить циклическую перезагрузку (критическая ошибка ядра)
- Сообщения о критической ошибке ядра присутствуют в журналах.
- Ошибки нехватки памяти присутствуют в журналах.
- В kern.info: 'Kernel panic - not syncing: Нехватка памяти и отсутствие убиваемых процессов'
Kern.info отображает ошибки нехватки памяти:
Aug 26 14:45:05 xxxx kernel: [ 1332.027261] (E4)Out of memory: Kill process 4769 (java) score 1 or sacrifice child Aug 26 14:45:05 xxxx kernel: [ 1332.044831] (E4)Out of memory: Kill process 22332 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.305280] (E4)Out of memory: Kill process 6131 (sms) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.321218] (E4)Out of memory: Kill process 5647 (lwsmd) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.324153] (E4)Out of memory: Kill process 22442 (dd_usm) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.325088] (E4)Out of memory: Kill process 25402 (dd_ha_vol-ha_li) score 0 or sacrifice child Aug 26 14:45:08 xxxx kernel: [ 1335.326060] (E4)Out of memory: Kill process 22459 (csmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.519181] (E4)Out of memory: Kill process 6415 (lwsmd) score 0 or sacrifice child Aug 26 14:45:12 xxxx kernel: [ 1338.522521] (E4)Out of memory: Kill process 6412 (sms) score 0 or sacrifice child
Cause
Система продолжит перезагружаться после модернизации контроллера (например, с DD9300 до DD9900). Файловая система была отключена, чтобы предотвратить циклическую перезагрузку DD.
В журналах ядра отображается несколько ошибок нехватки памяти (OOM), которые вызывают критическую ошибку ядра и последующие перезагрузки.
Основная причина проблемы — нехватка памяти для правильной работы системы. Это может быть вызвано несколькими причинами, включая, но не ограничиваясь:
- Утечка памяти в системном ПО
- Недостаточно памяти, выделенной для определенных процессов или служб
- Неправильная конфигурация системы, приводящая к чрезмерному использованию памяти
- Проблемы с оборудованием, такие как неисправные модули памяти или другие компоненты
- Возможно, был задан недопустимый раздел реестра. Этот раздел должен быть удален службой поддержки. система. MEM_HUGETLB=ЛОЖЬ.
Требуется дальнейшее исследование, чтобы определить точную причину истощения памяти и устранить ее соответствующим образом.
Просмотрите системные журналы и сообщения об ошибках, чтобы определить конкретные процессы или службы, которые могут потреблять слишком много памяти и вызывать ошибки OOM.
Кроме того, проверка использования и конфигурации системной памяти может помочь выявить любые ошибки в конфигурациях или проблемы с оборудованием, которые могут привести к возникновению проблемы.
Например: Отсутствующие или неправильно размещенные модули DIMM могут привести к неподдерживаемой конфигурации; что предотвратит запуск файловой системы.
Resolution
- Проверьте системные журналы на наличие сообщений об ошибках или предупреждений, связанных с использованием памяти или неправильной конфигурацией системы. Решайте их соответствующим образом.
- Если проблема не будет устранена, обратитесь в службу поддержки Dell для получения дополнительной помощи. Обязательно предоставьте соответствующие системные журналы или диагностическую информацию, которая поможет в устранении проблемы.
- Support Bundle и соответствующий пакет Core|Файлы дампа ядра для загрузки