Isilon: Node kann nicht mit mehreren Fehlern gestartet werden, einschließlich "This system has 0 formatted boot disk." und "UnbootableBootdiskException: 5“.

Summary: Wenn ein node, der vom BMC/CMC betroffen ist, das im Wissensdatenbank-Artikel beschriebene Problem aufhängt, 466373 neu gestartet wird, ohne zuerst beide Netzkabel zu trennen und darauf zu warten, dass die verbleibende Stromversorgung abfließt, kann er möglicherweise nicht mit mehreren Fehlern starten, einschließlich "This system has 0 formatted boot disk." und "UnbootableBootdiskException: 5“. IPMI-bezogene Fehler werden in diesem Fall ebenfalls häufig angezeigt. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms


Wenn ein node, der vom BMC/CMC betroffen ist, das im Wissensdatenbank-Artikel beschriebene Problem aufhängt, 466373 neu gestartet wird, ohne zuerst beide Netzkabel zu trennen und darauf zu warten, dass die verbleibende Stromversorgung abfließt, kann er möglicherweise nicht mit einer Reihe von Fehlern gestartet werden, die den folgenden ähneln:
 
<isi_rc> Executing script isi_bootdisk_init
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
Executing GEOM bootdisk startup...
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
This system has 0 formatted boot disk.
UnbootableBootdiskException: 5: Exception caught in startup attempt 1
Traceback (most recent call last):
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in
handle_bootdisk_ids
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in
zero_bootdisks
UnbootableBootdiskException: 5
The system is unbootable.
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8
2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8
drive_bay doesn't know chassis Unknown, portcount 8
GEOM start failed

Wenn dieser Startfehler durch einen hängenden BMC verursacht wird, zeigt ein früherer Teil der Startsequenz an, dass der Kernel das ipmi0-Gerät nicht ordnungsgemäß initialisieren konnte (die letzte Zeile sollte 4 anstelle von 0 unter normalen Bedingungen lauten):

ipmi0: Markierungen ungültig ipmi0
löschen: Anzahl der Kanäle 0 

Cause

Ein bekanntes BMC-Firmwareproblem auf HD400-, S210-, X210-, X410- und NL410-Nodes führt manchmal dazu, dass der BMC des Node hängen bleibt. Wenn der BMC des Node nicht reagiert, kann OneFS das EEPROM, das während des Startvorgangs mit dem CMC verbunden ist, nicht lesen, um festzustellen, auf welcher Art von Gehäuse er ausgeführt wird.  Wenn OneFS den Gehäusetyp nicht bestimmen kann, kann es nicht bestimmen, wie ordnungsgemäß auf die Startlaufwerke im betroffenen Node zugegriffen wird, und der Startversuch schlägt fehl.

Resolution

Es ist eine Aktualisierung der BMC-Firmware verfügbar, um zukünftige Vorkommen dieses Problems zu verhindern. Bevor die neue Firmware angewendet werden kann, muss jedoch zuerst die Aufhängebedingung behoben werden. Sie müssen den Node herunterfahren (shutdown -p now), beide Netzkabel entfernen, eine Minute warten, die Netzkabel wieder anschließen und den Node wieder hochfahren. Sie müssen diesen Aus- und Einschaltvorgang bis zu dreimal wiederholen, um den Aufhängezustand (reagiert nicht mehr) zu löschen. 

Sobald die nicht reagierende BMC-Bedingung gelöscht wurde, zeigt der BMC-Firmwareaktualisierungsvorgang im Wissensdatenbank-Artikel 466373 S210, X210, X410, NL410 oder HD400 das Ereignis an: "Node Baseboard Management Controller (BMC) und/oder Chassis Management Controller (CMC) reagieren nicht , um das zugrunde liegende Problem zu mindern, das dieses Problem verursacht.

AUFMERKSAMKEIT: Wenn das im oben genannten Wissensdatenbankartikel beschriebene Verfahren zum Aus- und Einschalten das Problem nach drei Versuchen immer noch nicht behebt, wenden Sie sich an den technischen Support von EMC Isilon und verweisen Sie auf diesen KB-Artikel.

Affected Products

Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410
Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.