166 メッセージ
0
1258
Isilon Boot Drive の障害について
Isilon にてBoot Driveの交換が必要と通知が来たのですが、以下の疑問がございます。
X400を利用です。
・ブートドライブとはどういった機能を提供しているのか?
・物理的構成図をもとにどこが壊れているのか?
・ブートドライブ交換に伴い、ノードのリブートも必要となるが、本当にサービス影響はないのか?
・ブートドライブとは消耗品か?
・消耗品であれば、今後、経年劣化から他のノードでも多発してくるのか?
・この経年劣化を事前に予知予測できる方法はあるのか?
ayas
Moderator
Moderator
•
6.5K メッセージ
0
2018年4月18日 17:00
Kiyoさん、
KBなどからの情報をもとにまとめました。
・
➡OneFSOSを含み,またNodeやClusterの設定情報も含みます。(参照1、3)
➡ハードウェアモデルによって異なりますがXシリーズの場合はシャーシにあります。(参照2)
➡Node毎に行えばサービス影響はないはずです。(参照5)
➡交換手順があることからも消耗品であるといえます。(KB、交換手順書、から)
➡可能性はあるといえます。(参照4)
➡アラートメールの設定で可能です。(参照6)
参考KB :
November 24, 2017 - 474985 - What is an Isilon Boot Disk and what does it do?
(https://support.emc.com/kb/474985)
参照1 These partitions store the entirety of OneFS OS
参照2 Nodes whose models starts with S, X, NL, HD all have boot drives in the chassis. There are 2 SATA flash modules that plug into the internal SATA controllers on the motherboard. These now contain the 4 OneFS partitions. It is also where logs and core dumps are stored (/var/log, /var/crash). Additionally, these 2 "drives" are mirrored copies of each other. In this "design", heavy logging to /var/log will mean there is more wear on the boot drives.
参照3Node specific configs are usually stored on the boot drives. This includes the node uuid, information about the drives attached to the node, etc... Clusterwide configs are usually stored on /ifs/.ifsvar/. Some cluster wide config are also stored on the boot drive themselves.
参照4OneFS monitors the wear levels of these drives and if they fail, they should be replaced immediately.
https://support.emc.com/docu44413_X400-Boot-Drive-Replacement-Guide.pdf?language=en_US 交換手順書から
参照5 Perform this procedure on only one node at a time. Performing maintenance on multiple nodes in parallel may lower the protection level of the cluster, put data at risk, and lead to the interruption of client workflows.
参照6 Isilon - Internal Boot Disk notification settings wear_life threshold exceededの設定方法