PowerEdge: Запуск ОС Linux ресурсів, що викликає перезавантаження
Summary: SUSE Linux Enterprise Server для SAP перезавантажувався з перервами, один або два рази на тиждень.
Symptoms
З логів кластера вказано, що вторинки перезавантажили первинний вузол через збій з контролем ресурсів кластера.
Cause
Переглянув логи перед перезавантаженням і виявив наступне.
Resolution
При появі помилки "Ресурс тимчасово недоступний" це свідчить про те, що в ОС закінчувалися ресурси.
У цьому випадку перевірте звіт SAR на час до перезавантаження сервера.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Виконується 32 611 процесів. Однак допустимими максимальними процесами є:kernel.pid_max = 32768 (Отримайте це з файлу журналу env.txt або з команди ОС "sysctl -a | grep pid_max"
Таким чином, цей висновок зробив висновок, що сервер досяг максимуму дозволених процесів. Клієнт може перевірити за допомогою команди «ps auxЩоб переглянути, чи всі процеси потрібні, або це можуть бути процеси, які не зупинені належним чином і продовжувати створювати нові процеси.
Виправили непотрібні процеси, виправили проблему