NetWorker: bloqueo de RabbitMQ durante el inicio
Resumen: NetWorker comenzó, pero quedó inactivo después de unos segundos.
Síntomas
El cliente descubrió que NMC se bloquea y todos los flujos de trabajo están en modo programado.
Reiniciar el servidor de NetWorker y reiniciar el sistema operativo no resuelve el problema.
No todos los procesos de nsr se están ejecutando (nsrexecd está activo, pero no nsrmmd)
Causa
En el registro daemon.raw, se observa una gran cantidad de bloqueos de RabbitMQ antes del apagado de nsr de todos los nsrmmd.
Este es el bloqueo:
0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: 0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: RabbitMQ 3.6.14. Copyright (C) 2007-2017 Pivotal Software, Inc. 0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ## ## Con licencia de MPL. Consulte http://www.rabbitmq.com/ 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ## ## 0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ######### Registros: /opt/nsr/rabbitmq-server-3.6.14/var/log/rabbitmq/rabbit@NWServLnx.log 0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ###### ## /opt/nsr/rabbitmq-server-3.6.14/var/log/rabbitmq/rabbit@NWServLnx-sasl.log 0 04/0 07/2020 09:17:57 h 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ######### 0 04/07/2020 09:17:57 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: Iniciando agente... 0 04/07/2020 09:18:00 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: {"Kernel pid terminated",application_controller,"{application_start_failure,rabbit,{bad_return,{{rabbit,start,[normal,[]},{'EXIT',{error,{{shutdown,{failed_to_start_child,rabbit_memory_monitor,{badarg,[{lists,member,[disk,{error,bad_module}],[]}, {rabbit_memory_monitor,init,1,[{file,\"src/rabbit_memory_monitor.erl\"},{line,111}]},{gen_server2,init_it,6,[{file,\"src/gen_server2.erl\"}, {line,546}]},{proc_lib, init_p_do_apply,3,[{file,\"proc_lib.erl\"},{line,247}]}]}}}, {secundario,no definido,rabbit_memory_monitor_sup,{rabbit_restartable_sup,start_link,[rabbit_memory_monitor_sup,{rabbit_memory_monitor,start_link,[]},false]},transitorio,infinity,supervisor,[rabbit_restartable_sup]}}}}}} "}^M 0 04/07/2020 09:18:00 h 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: Pid de kernel finalizado (application_controller) ({application_start_failure,rabbit,{bad_return,{{rabbit,start,[normal,[]]},{'EXIT',{error,{{shutdown,{failed_to_start_child,rabbit_memory_monitor,{badarg^M 0 04/07/2020 09:18:00 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: ^M 0 04/07/2020 09:18:00 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: El volcado de memoria se escribe en: erl_crash.dump... 0 04/07/2020 09:18:02 AM 1 5 0 557012736 2127 0 NWServLnx nsrctld NSR notice rmq: done^M
Tenemos la misma firma que kb 534881 y algunos casos donde / estaba lleno.
En mi caso, NW se instaló en /opt y este punto de montaje no estaba lleno con 42 MB de espacio libre:
Tamaño del sistema de archivos Utilizado Uso disponible% Montado en /dev/sda1 9.9G 3.6G 5.8G 39 % / devtmpfs 16G 8.0K 16G 1 % /dev tmpfs 16G 0 16G 0 % /dev/shm /dev/sdc1 10G 9.9G 42M 96 % /opt << NW se instaló aquí
De hecho, RabbitMQ requirió un mínimo de 50 MB para el espacio libre.
Consulte aquí: https://community.pivotal.io/s/article/Unable-to-Start-rabbitmqserver-Node-after-Upgrading-RabbitMQ-for-Pivotal-Cloud-Foundry