Isilon: 「This system has 0 formatted boot disk.」や「UnbootableBootdiskException: 」

Summary: BMC/CMCの影響を受けたノードが、最初に両方の電源コードを外し、残りの電力が放電されるのを待たずに、KB記事466373で説明されている問題がハングすると、「This system has 0 formatted boot disk.」や「UnbootableBootdiskException: 」この場合、IPMI関連のエラーも頻繁に発生します。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms


BMC/CMCの影響を受けるノードが、最初に両方の電源コードを外さずに再起動され、残りの電源が放電されるのを待たずに、 KB記事466373で説明されている問題がハングアップすると、次のような一連のエラーで起動に失敗する可能性があります。
 
<isi_rc> Executing script isi_bootdisk_init
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
Executing GEOM bootdisk startup...
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
This system has 0 formatted boot disk.
UnbootableBootdiskException: 5: Exception caught in startup attempt 1
Traceback (most recent call last):
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1831, in startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1741, in _startup
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1657, in
handle_bootdisk_ids
  File "/usr/local/lib/python2.6/site-packages/isi/sys/bootdisk.py", line 1580, in
zero_bootdisks
UnbootableBootdiskException: 5
The system is unbootable.
python: Unable to open /var/run/mlx4_core0.vpd for writing: Read-only file system
2016-01-02T14:00:24-07:00 python: dbay_localbm: baymap unknown for chas 0 dskctl 8 portcount 8
2016-01-02T14:00:24-07:00 python: dbay_chascache_init: drive_bay doesn't know chassis Unknown, portcount 8
drive_bay doesn't know chassis Unknown, portcount 8
GEOM start failed

この起動エラーがハングBMCによって発生した場合、ブート シーケンスの以前の部分では、カーネルがipmi0デバイスを正しく初期化できなかったことが示されます(通常の状況では、最後の行は0ではなく4と表示されます)。

ipmi0: クリア フラグ不正
ipmi0: チャネル数 0 

Cause

HD400、S210、X210、X410、NL410ノードの既知のBMCファームウェアの問題により、ノードのBMCが異常停止することがあります。ノードのBMCが応答していない場合、OneFSは起動中にCMCに接続されているEEPROMを読み取って、実行しているシャーシの種類を判断できません。  OneFSがシャーシ タイプを判別できない場合、影響を受けるノードのブート ドライブに適切にアクセスする方法を判断できず、起動の試みが失敗します。

Resolution

この問題の将来の発生を防ぐために利用できるBMCファームウェアのアップデートがあります。ただし、新しいファームウェアを適用する前に、最初にハング状態を修復する必要があります。ノードをシャットダウンし(今すぐシャットダウン-p)、両方の電源コードを取り外し、1分間待ってから電源コードを差し込み、ノードを元に戻す必要があります。ハング(応答を停止)状態をクリアするには、この電源の入れ直しプロセスを 最大3回繰り返す必要があります。

応答しないBMCの状態がクリアされるとKB記事「 S210、X210、X410、NL410、HD400 466373詳細なBMCファームウェア アップデート プロセスに次のイベントが表示されます。「ノードのベースボード マネジメント コントローラー(BMC)および/またはシャーシ管理コントローラー(CMC)が応答しない場合、 この問題の原因となっている根本的な問題が軽減されます。

注意:前述のKBに記載されているAC電源の入れ直し手順で 、3回試行しても問題が解決しない場合は、EMC Isilonテクニカル サポートに連絡して、このKB記事を参照してください。

Affected Products

Isilon, Isilon HD400, Isilon NL410, PowerScale OneFS, Isilon S210, Isilon X210, Isilon X410
Article Properties
Article Number: 000052205
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.