74 メッセージ
0
683
VxRailにおけるNode交換手順について
お世話になっております。
VxRailの新旧Node交換についてご教示ください
既存10Nodeを超えるVxRailクラスタにおいて古い4Nodeを新しい4Nodeに交換する手順について、
手順書を確認すると一般的には新しいNodeを追加して古いNodeを追加することになると思うのですが
一般的な方法としては以下のどちらがより推奨される手順でしょうか
・一度に複数台(今回は4台)を一気に追加して、その後で一度に複数台(4台)を一気に削除する
・1 Nodeづつ追加してから、1 Nodeづつ削除する
vSANのリバランスやVMの移動との兼ね合いによるとは思いますが、
リバランスによるパフォーマンス劣化を考慮しないなら追加は一度にしてもいいかと思うのですが
削除は安全の観点から1 Nodeづつ(リバランス完了後)削除するのが推奨手順かと思っていますが
新旧Node交換の推奨手順についてご教示いただければと存じます。
NodeはEモデルのAF、対象既存Nodeのバージョンは4.7.410になります
kwmt
4 Operator
4 Operator
•
877 メッセージ
2
2021年7月26日 21:00
Node 追加については最初に必要分拡張しておくのが手間が無く良いかと思います。
VxRail の Node Remove Procedure の手順では 1 Node ずつの取り外しが記載されている事と、
vSAN として推奨される操作も取り外し (decommission) は 1 Node ずつが推奨されております。
負荷の少ない時間帯に 1 Node ずつ「全データの退避」オプションでメンテナンスモードに移行して、移行完了後に取り外すのが安全で確実だと思われます。
https://core.vmware.com/resource/vsan-operations-guide#sec6737-sub1
DELL-Naoyuki K
4 Operator
4 Operator
•
1.8K メッセージ
0
2021年7月27日 23:00
補足です。
kwmtさんもおっしゃっているように、VxRail としての Node Remove の手順は 1 Node ずつしかできません。
vSAN 観点での 「全データ退避」のメインテナンスモードについても、複数 Node で同時に実施できなかったと思います。
過去に私が対応した案件で、VxRail に 4Node を追加して、古い3Nodeを削除するという作業があり、4Node追加後に、削除する3Node を全部まとめて 「全データ退避」でメインテナンスモードに移行させてようとしたところ、複数のNodeで同時にその作業をすることができず、目論見は失敗に終わりました。結果としてパラレルで計算していた作業時間がシリアル作業になってしまい、予定時間を大幅に超過する結果になり、お客様にご迷惑をおかけしてしまいました。
最新のvSANでは挙動を確認していないですが、おそらくvSANの仕様として、「全データ退避」を選択すると、Decomissioning 状態のvSAN objectが発生し、Decomissioning状態のオブジェクトがある状態で、追加のメインテナンスモードに入れることは Data Unavailability のリスクがあるため、システム的に制限がかかっていると思われます。
したがって、作業時間見積もりの安全性の観点から言っても、1Nodeずつのほうが個人的には推奨です。(Node 削除作業もうまくいかなかったりするので Troubleshooting の時間を含める意味でも長めに見積もっておきたい)
なお、「全データ退避」でメインテナンスモードにした場合は上記の制限に引っかかりますが、「アクセシビリティの確保」であれば、Decomissioning は発生しないので、複数のNodeを同時にメインテナンスモードにすることができ、その状態で60分経過すれば(もしくはResync Immediatelyをすれば)、結果として複数Nodeのデータを同時に再構成することができますが、その場合は可用性が一時的に低下するので個人的には安全性の観点からお勧めしていません。