Isilon: El nodo no puede arrancar con varios errores, incluidos "This system has 0 formatted boot disk" y "UnbootableBootdiskException: 5'.
Summary: Cuando un nodo afectado por el problema de bloqueo de BMC/CMC descrito en el artículo de la base de conocimientos 466373 se reinicia sin desconectar primero ambos cables de alimentación y a la espera de que se agote la energía restante, es posible que no se inicie con varios errores, incluidos "This system has 0 formatted boot disk" y "UnbootableBootdiskException: 5'. Los errores relacionados con IPMI también se ven con frecuencia en este caso. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Cuando un nodo afectado por el problema de BMC/CMC se bloquea y se describe en el artículo de la base de conocimientos 466373 se reinicia sin desconectar primero ambos cables de alimentación y a la espera de que se agote la energía restante, es posible que no se inicie con un conjunto de errores similares a los siguientes:
<isi_rc> Executing script isi_bootdisk_init python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system Executing GEOM bootdisk startup... python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system This system has 0 formatted boot disk. UnbootableBootdiskException: 5: Exception caught in startup attempt 1 Traceback (most recent call last): File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in handle_bootdisk_ids File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in zero_bootdisks UnbootableBootdiskException: 5 The system is unbootable. python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system 2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8 2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8 drive_bay doesn't know chassis Unknown, portcount 8 GEOM start failed
Si esta falla de arranque se debe a un BMC bloqueado, una parte anterior de la secuencia de arranque muestra que el kernel no pudo inicializar el dispositivo ipmi0 correctamente (la última línea debe decir 4 en lugar de 0 en condiciones normales):
ipmi0: Borrar marcas ilegales
ipmi0: Cantidad de canales 0
Cause
En ocasiones, un problema conocido de firmware de BMC en los nodos HD400, S210, X210, X410 y NL410 hace que el BMC del nodo se bloquee. Cuando el BMC del nodo no responde, OneFS no puede leer el EEPROM conectado a la CMC durante el arranque para determinar en qué tipo de chasis se está ejecutando. Cuando OneFS no puede determinar el tipo de chasis, no puede determinar cómo acceder correctamente a las unidades de arranque en el nodo afectado y el intento de arranque falla.
Resolution
Hay una actualización del firmware de BMC disponible para ayudar a evitar futuras apariciones de este problema; Sin embargo, antes de que se pueda aplicar el nuevo firmware, primero se debe corregir la condición de bloqueo. Debe apagar el nodo (shutdown -p now), quitar ambos cables de alimentación, esperar un minuto, volver a enchufar los cables de alimentación y volver a encender el nodo. Debe repetir este proceso de ciclo de encendido hasta tres veces para borrar la condición de bloqueo (deja de responder).
Una vez que se borra la condición de BMC que no responde, el proceso de actualización del firmware de BMC detallado en el artículo de la base de conocimientos 466373 S210, X210, X410, NL410 o HD400 muestra el evento: "La controladora de administración de placa base (BMC) del nodo o la controladora de administración del chasis (CMC) no responden , lo que mitiga el problema subyacente que causa este problema.
ATENCIÓN: Si el procedimiento del ciclo de apagado y encendido de CA descrito en el artículo de la base de conocimientos mencionado anteriormente aún no resuelve el problema después de tres intentos, comuníquese con el soporte técnico de EMC Isilon y mencione este artículo de la base de conocimientos.
Una vez que se borra la condición de BMC que no responde, el proceso de actualización del firmware de BMC detallado en el artículo de la base de conocimientos 466373 S210, X210, X410, NL410 o HD400 muestra el evento: "La controladora de administración de placa base (BMC) del nodo o la controladora de administración del chasis (CMC) no responden , lo que mitiga el problema subyacente que causa este problema.
ATENCIÓN: Si el procedimiento del ciclo de apagado y encendido de CA descrito en el artículo de la base de conocimientos mencionado anteriormente aún no resuelve el problema después de tres intentos, comuníquese con el soporte técnico de EMC Isilon y mencione este artículo de la base de conocimientos.
Affected Products
Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.