新しい会話を開始

未解決

この投稿は5年以上前のものです

1 Rookie

 • 

20 メッセージ

922

2017年9月26日 02:00

Unity 筐体間フェイルオーバーのタイミングについて

東京と大阪で、それぞれUnity(File)を導入しレプリケーションさせます。

例えば、東京側で障害が発生した場合、2台のUnity間の死活確認はどのように行われていますか?

大阪側のUnityにフェイルオーバーする切替のタイミングを知りたいです。

Community Manager

 • 

5.1K メッセージ

2017年9月27日 01:00

CamoMileさん

死活確認の仕様については公開されているものがなかったので、実機を利用して確認してみました。

具体的には、筐体間非同期レプリケーション(File)を行っているUnityのネットワークインタフェースをダウンさせ、どれくらいでレプリケーションがその問題(通信不可能)に気が付くのかの確認を行いました。

結果はファイルレプリケーションを開始してすぐ(1秒程度)で通信不可能に気が付きました。これは実際に自分のハードウェア(SPのネットワークインタフェース)に問題があるために検知が早いという可能性が高いですが、もしもネットワーク側のIPスイッチ等に問題があった場合でも、数秒から数十秒で検知するものと考えられます。

ただ、その検知までにかかる時間よりも重要なことは、実際にUnity筐体間でデータのやり取りを始めるまでは異常に気が付かないという点です。

今回も意図的に同期を開始させたレプリケーションセッションはネットワークインタフェースの異常を検知した一方で、RPOの設定が長く、実際にデータのやり取りを行っていないレプリケーションセッションは正常ステータスのままであるという動きをしていました(OE4.2です)。

また、参考情報ですがレプリケーションに問題が発生した際にUnityは自動でフェイルオーバーは行いません。

誰かが明示的にフェイルオーバーの命令をUnityに対して行う必要があるのですが、レプリケーションソースに対してその命令を行う場合(Planned failover)と、レプリケーションターゲットに対して行う場合(Unplanned failover)で動作が異なる点にご注意ください。(まぁ実際の障害発生時にはターゲット側から命令発行を行うUnplanned failoverしか実施できないので悩むことはなさそうですが)

このPlannedとUnplanned failoverの動作の違いについてはDELL EMC UNITY:REPLICATION TECHNOLOGIES A Detailed Review P.24~P.25「FAILOVER WITH SYNC, FAILOVER, AND FAILBACK」セクションに説明があります。

FYI:試験している時に道連れ(?)でブロックの同期レプリケーションもダウンしたのですが、この検知には1分31秒かかりました。

1 Rookie

 • 

20 メッセージ

2017年9月28日 00:00

Uehara Y.さん

実機検証をして頂き誠に有り難うございます!

留意点なども記載くださり大変参考になりました。

イベントは見つかりませんでした!

Top