未解決
1 Rookie
•
30 メッセージ
0
151
VxRail ホスト追加 NIC構成の画面で内部エラー
いつもお世話になっております。
以下の構成で利用していました。
-----
Model:E560F
VxRail 7.0.370
3ノード構成
-----
今回検証環境のVxRailにおいて、3ノード中の1ノードでUEFI Secure Bootが失敗する状態になり、ノードが上がらない状態になりました。リカバリキーを取得していなかったので、回復は困難と判断。
3ノードをシャットダウンしていたので、残りの2ノードでvSANの手動再起動を用いて(障害ESXiをvSANユニキャストリストから削除を実施)、vSANとしてはリカバリし、既存VMは利用できる状態になりました。フォールトドメインがないためか、VMの作成やスナップショット取得などはできない様でした。
vSphere Clientより、障害ノードに[VxRailホストの削除]を実施し、クラスタから削除。
障害ノードをRASRにより初期化し、再度追加を実施していたところ、以下エラーに遭遇しました。
ホストは検出できているが、NIC構成の情報が表示されない。
いくつかのKBによるとVxRail Manager側にホストの情報が残っているため、このようになるとのことで、
ManagerのDBからホストの情報を削除する手順を試そうとしました。
dell_node_replacement.pyを用いる方法
しかし、障害ホストはおそらくDB側に残っていないのか、表示されるのは生き残っている2ノードのみでした。
原因に心当たりがあればご教授いただけないでしょうか。
よろしくお願いいたします。
DELL-Naoyuki K
4 Operator
4 Operator
•
1.8K メッセージ
0
2023年6月25日 20:00
個別でメッセージを送信させていただきました。
shirano2
1 Rookie
1 Rookie
•
60 メッセージ
0
2023年6月23日 00:00
既にいくつかご確認いただいております通り、様々な原因が考えられるかと思います。
dell_node_replacement.py未実施にも関わらず、既に2Nodeしか表示されないということのため、DB上に削除しきれなかった情報が残っているかもしれませんし、他の要因があるかもしれません。
細かい切り分けなどについては、ログなどからも調査が必要となるかと思われますので、必要に応じてサポートに連絡してみてはいかがでしょうか。
DELL-Naoyuki K
4 Operator
4 Operator
•
1.8K メッセージ
0
2023年6月23日 00:00
外部VC構成であれば、管理用ユーザのパスワード期限切れなどでも同様の状態になったことがありますが、表示されているエラーメッセージ自体は汎用的なものなので原因を突き止めるためにはログを見る必要がありそうです。
とりあえず手あたり次第に実施したい場合は、
・iDRAC Reset
・各ノードでesxcli vxrail agent get でtrueを確認
・簡易放電(全ノード)
などが考えられます。
gazania
1 Rookie
1 Rookie
•
30 メッセージ
0
2023年6月25日 08:00
ご回答ありがとうございます。
・vCenter Inventoryにホスト情報が残っている → vSphere ClientよりホストのInventory削除
・VxRail Manager DB内にホスト情報が残っている → dell_node_replacement.py の実施・DBなどの手動編集
・他のNodeなどで物理View上に表示の問題がある → platform service/iDRAC/Management Accountなどの問題有無切り分け
・DNS設定情報に誤りがある → DNS側のエントリー確認
この辺りだと、確かにManagerのDB上に削除しきれなかった情報があるかもしれません。
一応VxRailの機能の中でホスト削除実施しているので(VxRail Managerのプラグイン)、このあたりの情報もクリアしてくれていると思いたいですが。
確かに正式な方法ではdell_node_replacement.pyを利用した手順ですので、何か駄目な理由があるのかと思いました。
上記項目含めていくつか調査しましたが、まだ改善できていません。
この事象を調査するにあたり、調査すべきログファイルをご存じでしたら、いくつかご教授していただけませんでしょうか。
サポートの利用も検討していますが、当環境は検証環境ですので、難しそうな場合はRASRでの初期化構築も検討してます。