PowerEdge: La ejecución de recursos del SO Linux provoca un reinicio
Summary: SUSE Linux Enterprise Server para SAP se reiniciaba de forma intermitente, una o dos veces por semana.
Symptoms
En los registros del clúster, se indicó que el secundario reinició el nodo principal debido a la falla monitoreada por los recursos del clúster.
Cause
Se revisaron los registros antes del reinicio y se descubrió lo siguiente.
Resolution
Con el error "Recurso no disponible temporalmente", esto indica que el SO se estaba quedando sin recursos.
En este caso, compruebe el informe de SAR en el momento antes del reinicio del servidor.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Hay 32 611 procesos en ejecución. Sin embargo, los procesos máximos permitidos son los siguientes:kernel.pid_max = 32768 (Obtenga esto del archivo de registro env.txt o desde el comando OS "sysctl -a | grep pid_max"
Así concluye que el servidor alcanzó el máximo de procesos permitidos. El cliente puede verificarlo con el comando "ps aux" Revisar si todos los procesos son necesarios o podría ser que los procesos no se detengan adecuadamente y seguir creando nuevos procesos.
Se corrigieron los procesos innecesarios se corrigió el problema