Isilon : Le nœud ne parvient pas à démarrer avec plusieurs erreurs, notamment « This system has 0 formatted boot disk. » et « UnbootdiskException : 5 ».

Summary: Lorsqu’un nœud affecté par le problème de blocage BMC/CMC décrit dans l’article de la base de connaissances 466373 est redémarré sans débrancher les deux cordons d’alimentation et attendre que l’alimentation restante se décharge, il peut ne pas démarrer avec plusieurs erreurs, notamment « Ce système dispose d’un disque de démarrage au format 0 » et « UnbootdiskException : 5 ». Les erreurs liées à IPMI sont également souvent observées dans ce cas. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms


Lorsqu’un nœud affecté par le problème de blocage BMC/CMC décrit dans l’article de la base de connaissances 466373 est redémarré sans débrancher les deux cordons d’alimentation et attendre que l’alimentation restante se décharge, il peut ne pas démarrer avec un ensemble d’erreurs similaires à ce qui suit :
 
<isi_rc> Executing script isi_bootdisk_init
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
Executing GEOM bootdisk startup...
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
This system has 0 formatted boot disk.
UnbootableBootdiskException: 5: Exception caught in startup attempt 1
Traceback (most recent call last):
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in
handle_bootdisk_ids
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in
zero_bootdisks
UnbootableBootdiskException: 5
The system is unbootable.
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8
2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8
drive_bay doesn't know chassis Unknown, portcount 8
GEOM start failed

Si cette défaillance de démarrage est causée par un BMC suspendu, une partie antérieure de la séquence de démarrage montre que le noyau n’a pas pu initialiser correctement le périphérique ipmi0 (la dernière ligne doit indiquer 4 au lieu de 0 dans des conditions normales) :

ipmi0 : Effacer les balises ipmi0 illégales
 : Nombre de canaux 0 

Cause

Un problème de firmware BMC connu sur les nœuds HD400, S210, X210, X410 et NL410 provoque parfois le blocage du contrôleur BMC du nœud. Lorsque le contrôleur BMC du nœud ne répond pas, OneFS n’est pas en mesure de lire l’EEPROM connecté au CMC pendant le démarrage pour déterminer le type de châssis sur lequel il s’exécute.  Lorsque OneFS ne parvient pas à déterminer le type de châssis, il ne peut pas déterminer comment accéder correctement aux disques de démarrage dans le nœud concerné, et la tentative de démarrage échoue.

Resolution

Une mise à jour du micrologiciel BMC est disponible pour éviter les occurrences futures de ce problème. Toutefois, avant que le nouveau micrologiciel puisse être appliqué, la condition de blocage doit d’abord être corrigée. Vous devez arrêter le nœud (arrêtez -p maintenant), retirez les deux cordons d’alimentation, patientez une minute, rebranchez les cordons d’alimentation et remettez le nœud sous tension. Vous devez répéter ce processus de cycle d’alimentation jusqu’à trois fois pour effacer la condition de blocage (cesse de répondre). 

Une fois que la condition BMC ne répond plus, le processus de mise à jour du firmware BMC détaillé dans l’article de la base de connaissances 466373 S210, X210, X410, NL410 ou HD400 affiche l’événement : « Le contrôleur BMC (Baseboard Management Controller) du nœud et/ou le contrôleur de gestion du châssis (CMC) ne répondent pas , ce qui limite le problème sous-jacent à l’origine de ce problème.

ATTENTION: Si la procédure de cycle d’alimentation secteur décrite dans la base de connaissances mentionnée ci-dessus ne résout toujours pas le problème après trois tentatives, contactez le support technique EMC Isilon et faites référence à cet article de la base de connaissances.

Affected Products

Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410
Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.