Isilon: 節點無法開機並出現多個錯誤,包括「本系統有 0 格式的開機磁碟」和「UnbootableBootdiskException:5'.
Summary: 當受 BMC/CMC 當機問題影響的節點在 KB 文章中所述,466373重新啟動而未先拔下兩條電源線,且等待剩餘電源耗盡時,它可能會無法開機並出現多個錯誤,包括「本系統有 0 格式的開機磁碟」和「UnbootableBootdiskException:5'.此案例也經常出現IPMI相關錯誤。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
當受 BMC/CMC 停止回應問題影響的節點在 KB 文章中所述,466373重新啟動,而未先拔下兩條電源線,並等待剩餘的電力耗盡時,可能無法開機並出現類似下列一組的錯誤:
<isi_rc> Executing script isi_bootdisk_init python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system Executing GEOM bootdisk startup... python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system This system has 0 formatted boot disk. UnbootableBootdiskException: 5: Exception caught in startup attempt 1 Traceback (most recent call last): File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in handle_bootdisk_ids File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in zero_bootdisks UnbootableBootdiskException: 5 The system is unbootable. python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system 2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8 2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8 drive_bay doesn't know chassis Unknown, portcount 8 GEOM start failed
如果此開機失敗是由懸吊 BMC 所造成,則開機順序的先前部分會顯示核心無法正確初始化 ipmi0 裝置 (最後一行應在正常情況下為 4 而不是 0):
ipmi0:清除非法
ipmi0 旗標:通道 0 的數目
Cause
在 HD400、S210、X210、X410 和 NL410 節點上已知的 BMC 韌體問題有時會導致節點的 BMC 當機。當節點的 BMC 未回應時,OneFS 無法在開機期間讀取連接至 CMC 的 EEPROM,以判斷其執行的機箱類型。 當 OneFS 無法判斷機箱類型時,無法判斷如何正確存取受影響節點中的開機磁碟驅動器,且開機嘗試失敗。
Resolution
有 BMC 韌體的更新可用來協助避免未來發生此問題;但是,在新韌體套用之前,必須先修正無響應狀況。您必須關閉節點 (立即關機),卸下兩條電源線,等待一分鐘,將電源線重新插入,然後重新啟動節點。您必須重複此重新啟動電源程式 三次,才能清除停止響應的狀況。
清除無回應的 BMC 條件後,KB 文章中詳述的 BMC 韌體更新程式會466373 S210、X210、X410、NL410 或 HD400 顯示事件:「節點的基板管理控制器 (BMC) 和/或機箱管理控制器 (CMC) 沒有回應 ,可降低導致此問題的基本問題。
注意:如果上述 KB 中所述的 AC 電源迴圈程式在 嘗試三次後仍無法解決問題,請聯絡 EMC Isilon 技術支援並參考本知識庫文章。
清除無回應的 BMC 條件後,KB 文章中詳述的 BMC 韌體更新程式會466373 S210、X210、X410、NL410 或 HD400 顯示事件:「節點的基板管理控制器 (BMC) 和/或機箱管理控制器 (CMC) 沒有回應 ,可降低導致此問題的基本問題。
注意:如果上述 KB 中所述的 AC 電源迴圈程式在 嘗試三次後仍無法解決問題,請聯絡 EMC Isilon 技術支援並參考本知識庫文章。
Affected Products
Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.