Isilon: Il nodo non si avvia con più errori, tra cui 'This system has 0 formatted boot disk'' e 'UnbootableBootdiskException: 5"

Summary: Quando un nodo interessato dal BMC/CMC blocca il problema descritto nell'articolo della Knowledge Base 466373 viene riavviato senza prima scollegare entrambi i cavi di alimentazione e attendere che l'alimentazione residua si scarichi, l'avvio potrebbe non riuscire con più errori, tra cui "This system has 0 formatted boot disk." e "UnbootableBootdiskException: 5" In questo caso si verificano spesso anche errori correlati a IPMI. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms


Quando un nodo interessato dal BMC/CMC blocca il problema descritto nell'articolo della Knowledge Base 466373 viene riavviato senza prima scollegare entrambi i cavi di alimentazione e in attesa che l'alimentazione residua si esaurisca, l'avvio potrebbe non riuscire con una serie di errori simili ai seguenti:
 
<isi_rc> Executing script isi_bootdisk_init
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
Executing GEOM bootdisk startup...
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
This system has 0 formatted boot disk.
UnbootableBootdiskException: 5: Exception caught in startup attempt 1
Traceback (most recent call last):
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in
handle_bootdisk_ids
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in
zero_bootdisks
UnbootableBootdiskException: 5
The system is unbootable.
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8
2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8
drive_bay doesn't know chassis Unknown, portcount 8
GEOM start failed

Se questo errore di avvio è causato da un BMC sospeso, una parte precedente della sequenza di avvio mostra che il kernel non è stato in grado di inizializzare correttamente il dispositivo ipmi0 (l'ultima riga dovrebbe essere 4 anziché 0 in condizioni normali):

ipmi0: Contrassegna come non valido
ipmi0: Numero di canali 0 

Cause

Un problema noto del firmware BMC sui nodi HD400, S210, X210, X410 e NL410 talvolta causa il blocco BMC del nodo. Quando il BMC del nodo non risponde, OneFS non è in grado di leggere la EEPROM collegata al CMC durante l'avvio per determinare il tipo di chassis su cui è in esecuzione.  Quando OneFS non è in grado di determinare il tipo di chassis, non è in grado di determinare come accedere correttamente alle unità di avvio nel nodo interessato e il tentativo di avvio non riesce.

Resolution

È disponibile un aggiornamento del firmware BMC per evitare occorrenze future di questo problema. tuttavia, prima di poter applicare il nuovo firmware, è necessario risolvere prima la condizione di blocco. È necessario arrestare il nodo (shutdown -p ora), rimuovere entrambi i cavi di alimentazione, attendere un minuto, ricollegare i cavi di alimentazione e riattivare il nodo. È necessario ripetere questo processo di ciclo di alimentazione fino a tre volte per eliminare la condizione di blocco (smette di rispondere). 

Una volta cancellata la condizione di BMC che non risponde, il processo di aggiornamento del firmware BMC descritto nell'articolo della Knowledge Base 466373 S210, X210, X410, NL410 o HD400 mostra l'evento: "Node's Baseboard Management Controller (BMC) and/or Chassis Management Controller (CMC) are unresponsive mitiga il problema sottostante che causa questo problema.

ATTENZIONE: Se la procedura di ciclo di alimentazione CA descritta nella KB sopra menzionata continua a non risolvere il problema dopo tre tentativi, contattare il supporto tecnico di EMC Isilon e fare riferimento a questo articolo della KB.

Affected Products

Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410
Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.