yoshi_taka
2 Iron

VxRail障害時のvSANリバランス動作について

VxRail4ノード構成にて、vSANの可用性ポリシーにてRAID1 FTT1構成し、1ノードまでの障害に耐えらえるようにしています。 1ノード障害発生時、デフォルトでは1時間経過後にリバランスが動き始める認識です。 このリバランス処理が完了すると残りの3ノードでRAID1 FTT1が構成された状態となり、再度冗長構成となるかと思いますが、このリバランス処理がどの程度で終わるか、ざっくりした目安を知りたいです。 もちろん、ディスクタイプ、ネットワーク環境、データ容量、データ配置状態など様々な状況次第で大きく異なってくることは重々承知しているのですが、実績ベースでどのような環境だった場合はどれくらいで終わったよ、という情報があれば是非共有していただきたいです。。
0 件の賞賛
3件の返信3

Re: VxRail障害時のvSANリバランス動作について

感覚ベースでざっくりなのでアテにならないかもしれませんが、10Gbps×2のネットワーク構成で、1TBあたりだいたい1~2時間だったと思います。






==== 自動追記 ====
投稿内容はすべて筆者個人としての投稿であり所属団体とは無関係です
Highlighted

Re: VxRail障害時のvSANリバランス動作について

いまラボで測ってみたところ、50GBで4分だったので1TBなら80分くらいですね。

サイズが小さすぎてあまり参考にはならないかもしれませんが、感覚的にはだいたい一致していました。

※Resyncの動作特徴として、Resyncの終了間際になると時間が伸びます。詳細は不明ですが、おそらくはコンポーネント数が減るとResyncの並列度が低くなるためだと思います。

 

ちなみにですが、障害時の再構築はリバランスではなく、ResyncもしくはRebuildと言います。

リバランスだと別の動作の意味になるのでご留意くださいませ。






==== 自動追記 ====
投稿内容はすべて筆者個人としての投稿であり所属団体とは無関係です
kwmt
3 Zinc

Re: VxRail障害時のvSANリバランス動作について

私も以前検証した際は kaneda さんの経験・検証と近い速度でした。

試した環境はVxRail 4.5 (vSAN 6.6.1) 環境、VxRail Gen3 AF vSAN 4 Node で 各ノードは 1.92TB x 3本のキャパシティ、VxRail Gen4 AF vSAN 4 Node で同一容量のキャパシティで、仮想マシンデータで全容量の50%まで利用した状態で

1 Node を疑似障害を起こし、仮想マシンのミラーの片割れの再同期を vSAN Health の再同期モニタと、RVCの Resync Dashboard で転送される速度を確認しました。

その時はGen3の構成では 3TB 前後の転送で5時間弱、Gen4の構成では4時間強と新しい方が速度は上でした。

 

参考までに、VxRail 4.7 (vSAN 6.7u1) では、Adaptive Resync 機能に大きな改善が入っているので、再構成中のIOと通常のVMのIOの調整もだいぶ良くなり、VM側のIOが少なければ高い処理能力を再構成に振り分けてくれるように改善されています。

https://storagehub.vmware.com/t/vmware-vsan/adaptive-resync-in-vsan-6-7/adaptive-resync/