Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Uso de Systemd para la recuperación automatizada del sistema

Summary: Con la inclusión de soporte para el hardware guardián, systemd ahora puede realizar la función de un demonio de vigilancia de Linux en los sistemas Dell PowerEdge.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Instructions

Con la inclusiónEste hipervínculo lo redirige a un sitio web fuera de Dell Technologies. de soporte paraEste hipervínculo lo redirige a un sitio web fuera de Dell Technologies. hardware guardián, systemdEste hipervínculo lo redirige a un sitio web fuera de Dell Technologies. ahora puede realizar la función de un demonio de vigilancia de Linux. En los sistemas Dell PowerEdge, este hardware podría ser el temporizador de vigilancia del chipset incorporado en el chipset de la plataforma (como Intel ICH9) o el temporizador de vigilancia BMC compatible con IPMI de Dell iDRAC.

Dell iDRAC proporciona una recuperación automatizada del sistema que, además de recuperarse de los bloqueos del sistema operativo, puede capturar una captura de pantalla para su análisis más adelante. Era necesario contar con software adicional en el sistema operativo para habilitarlo. Con distribuciones más recientes que admiten systemd, esta función funciona con software disponible de forma nativa en una distribución, lo que elimina la necesidad de software adicional.

Sin embargo, era posible usar el demonio guardián en Linux, pero había una probabilidad de que el demonio en sí pudiera bloquearse mientras el resto del sistema estaba en funcionamiento. systemd actúa como el guardián de software para todos los servicios del sistema y el temporizador de vigilancia de BMC actúa como el guardián de hardware para systemd mismo. Por lo tanto, si systemd no está en funcionamiento, existe una buena posibilidad de que el sistema no se pueda utilizar en general. Ahora tenemos un método más confiable para todos los servicios del sistema, el administrador de los servicios (systemd) que será "observado" por el temporizador de vigilancia de BMC.

El pegamento entre systemd y el guardián BMC de Dell iDRAC es el módulo de kernel ipmi_watchdog, que proporciona acceso a la APIEste hipervínculo lo redirige a un sitio web fuera de Dell Technologies. de vigilancia de Linux al guardián de BMC mediante /dev/watchdog. Systemd utiliza esta interfaz para iniciar el guardián periódicamente.

Configuración de systemd con ipmi_watchdog

Systemd se puede configurar para utilizar el guardián iDRAC BMC con estos pasos (en Fedora 19):

  1. Dado que el sistema tiene dos temporizadores de vigilancia (chipset y BMC), podemos usar cualquiera de ellos. En este ejemplo, deshabilitamos el guardián del chipset. El guardián del chipset se puede deshabilitar mediante la configuración de la opción "Operating system Watchdog Timer" (Temporizador de vigilancia del sistema operativo) en el BIOS del sistema en "Disabled" (Desactivado) (valor predeterminado).
  2. Llegue a un valor de tiempo de espera agotado para el guardián, por ejemplo, 180 segundos.
  3. Habilite el módulo de kernel ipmi_watchdog para cargar durante el inicio del sistema con el tiempo de espera de arriba:
  • Método 1: Cree /etc/modules-load.d/ipmi_watchdog con el siguiente contenido
    • Opciones ipmi_watchdog tiempo de espera =180
    • Rechazar lista iTCO_wdt n.º Opcional. Si el guardián del chipset no está deshabilitado en la configuración del BIOS.
  • Método 2:
    • Instale el rpm de OpenIPMI
      • $ sudo yum install OpenIPMI
    • Establezca IPMI_WATCHDOG=yes y IPMI_WATCHDOG_OPTIONS con el tiempo de espera agotado en /etc/sysconfig/ipmi.
    • Habilitar el servicio ipmi para que se inicie automáticamente
      • $ sudo systemctl enable ipmi
  • Habilite el guardián del sistema:
    • Quite la marca de comentario y configure RuntimeWatchdogSec=180 en /etc/systemd/system.conf
  • Reiniciar systemd
    • # systemctl daemon-reexec

Compruebe si esto funciona:

  1. Compruebe si el guardián está activo
    • $ sudo journalctl |grep -i 'hardware watchdog' # debe mostrar que systemd está configurado para utilizar el guardián IPMI.
    • $ sudo ipmitool mc watchdog obtener # compruebe si el "Temporizador de vigilancia es: Started/Running".
  2. Pruebe simulando un kernel panic (no lo haga en un sistema de producción). Asegúrese de que kdump esté deshabilitado.
    • $ sudo echo c > /proc/sysrq-trigger
  3. Después del restablecimiento del sistema, verifique que haya una imagen de la pantalla de falla disponible en iDRAC
    • Iniciar sesión en la interfaz de usuario web de iDRAC
    • Overview -> Server -> Troubleshooting -> Last Crash Screen.
NOTA: Actualmente, Dell no admite esta función y se comparte aquí con el propósito de solicitar comentarios de la comunidad en Recursos de Linux para servidores PowerEdge.

Article Properties


Last Published Date

19 Sept 2023

Version

6

Article Type

How To