Isilon: 节点无法启动,并显示多个错误,包括“This system has 0 formatted boot disk.”和“UnbootableBootdiskException:5”
Summary: 当受 BMC/CMC 影响的节点挂起问题在知识库文章中所述466373重新启动而不先断开电源线并等待剩余电量耗尽时,它可能无法启动,并显示多个错误,包括“This system has 0 formatted boot disk.”和“UnbootableBootdiskException:5”在这种情况下,也经常会出现与 IPMI 相关的错误。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
当受 BMC/CMC 影响的节点挂起问题( KB 文章中所述),466373重新启动而不先断开电源线的连接并等待剩余电量耗尽时,它可能无法启动,并显示类似于以下内容的一组错误:
<isi_rc> Executing script isi_bootdisk_init python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system Executing GEOM bootdisk startup... python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system This system has 0 formatted boot disk. UnbootableBootdiskException: 5: Exception caught in startup attempt 1 Traceback (most recent call last): File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in handle_bootdisk_ids File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in zero_bootdisks UnbootableBootdiskException: 5 The system is unbootable. python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system 2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8 2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8 drive_bay doesn't know chassis Unknown, portcount 8 GEOM start failed
如果此引导失败是由挂起 BMC 引起的,则引导顺序的早期部分显示内核无法正确初始化 ipmi0 设备(最后一行应在正常条件下表示 4 而不是 0):
ipmi0:清除标记非法
ipmi0:通道数量 0
Cause
HD400、S210、X210、X410 和 NL410 节点上的已知 BMC 固件问题有时会导致节点的 BMC 挂起。当节点的 BMC 没有响应时,OneFS 无法在引导过程中读取连接到 CMC 的 EEPROM,以确定它运行的机箱类型。 当 OneFS 无法确定机箱类型时,它无法确定如何正确访问受影响节点中的引导驱动器,并且引导尝试失败。
Resolution
BMC 固件有更新,可帮助防止将来出现此问题;但是,在应用新固件之前,必须先修复挂起情况。您必须关闭节点(立即关闭 -p),拔下两根电源线,等待一分钟,重新插入电源线,然后重新启动节点。您必须重复此电源关闭后重启过程 多达三次,以清除挂起(停止响应)情况。
清除无响应的 BMC 条件后,KB 文章中详细介绍的 BMC 固件更新过程466373 S210、X210、X410、NL410 或 HD400 显示事件:“节点的底板管理控制器 (BMC) 和/或机箱管理控制器 (CMC) 无响应 可缓解导致此问题的底层问题。
注意:如果上述 KB 中所述的交流电源关闭后重启过程在 三次尝试后仍未解决问题,请联系 EMC Isilon 技术支持并参考本知识库文章。
清除无响应的 BMC 条件后,KB 文章中详细介绍的 BMC 固件更新过程466373 S210、X210、X410、NL410 或 HD400 显示事件:“节点的底板管理控制器 (BMC) 和/或机箱管理控制器 (CMC) 无响应 可缓解导致此问题的底层问题。
注意:如果上述 KB 中所述的交流电源关闭后重启过程在 三次尝试后仍未解决问题,请联系 EMC Isilon 技术支持并参考本知识库文章。
Affected Products
Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.