PowerEdge: L'esecuzione delle risorse nel sistema operativo Linux causa un riavvio
Summary: SUSE Linux Enterprise Server per SAP veniva riavviato a intermittenza, una o due volte alla settimana.
Symptoms
Dai registri del cluster, indicato che il nodo primario secondario veniva riavviato a causa dell'errore monitorato dalle risorse del cluster.
Cause
Esaminati i registri prima del riavvio, i seguenti risultati.
Resolution
L'errore "Resource temporarily unavailable" indica che il sistema operativo sta esaurendo le risorse.
In questo caso, controllare il report SAR prima del riavvio del server.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Ci sono 32.611 processi in esecuzione. Tuttavia, il numero massimo di processi consentiti è:kernel.pid_max = 32768 (Ottenerlo dal file di registro) env.txt o dal comando del sistema operativo "sysctl -a | grep pid_max"
Quindi questo ha concluso che il server ha raggiunto il massimo dei processi consentiti. Il cliente può verificare con il comando "ps aux" per rivedere se tutti i processi sono necessari o potrebbero essere i processi non interrotti correttamente e continuare a creare nuovi processi.
Risolti i processi non necessari, risolto il problema