閲覧
ヘルプ
サインイン
未解決
この投稿は5年以上前のものです
CamoMile
1 Rookie
•
20 メッセージ
0
922
2017年9月26日 02:00
東京と大阪で、それぞれUnity(File)を導入しレプリケーションさせます。
例えば、東京側で障害が発生した場合、2台のUnity間の死活確認はどのように行われていますか?
大阪側のUnityにフェイルオーバーする切替のタイミングを知りたいです。
レスポンス(2)
Uehara Y.
Community Manager
5.1K メッセージ
2017年9月27日 01:00
CamoMileさん
死活確認の仕様については公開されているものがなかったので、実機を利用して確認してみました。
具体的には、筐体間非同期レプリケーション(File)を行っているUnityのネットワークインタフェースをダウンさせ、どれくらいでレプリケーションがその問題(通信不可能)に気が付くのかの確認を行いました。
結果はファイルレプリケーションを開始してすぐ(1秒程度)で通信不可能に気が付きました。これは実際に自分のハードウェア(SPのネットワークインタフェース)に問題があるために検知が早いという可能性が高いですが、もしもネットワーク側のIPスイッチ等に問題があった場合でも、数秒から数十秒で検知するものと考えられます。
ただ、その検知までにかかる時間よりも重要なことは、実際にUnity筐体間でデータのやり取りを始めるまでは異常に気が付かないという点です。
今回も意図的に同期を開始させたレプリケーションセッションはネットワークインタフェースの異常を検知した一方で、RPOの設定が長く、実際にデータのやり取りを行っていないレプリケーションセッションは正常ステータスのままであるという動きをしていました(OE4.2です)。
また、参考情報ですがレプリケーションに問題が発生した際にUnityは自動でフェイルオーバーは行いません。
誰かが明示的にフェイルオーバーの命令をUnityに対して行う必要があるのですが、レプリケーションソースに対してその命令を行う場合(Planned failover)と、レプリケーションターゲットに対して行う場合(Unplanned failover)で動作が異なる点にご注意ください。(まぁ実際の障害発生時にはターゲット側から命令発行を行うUnplanned failoverしか実施できないので悩むことはなさそうですが)
このPlannedとUnplanned failoverの動作の違いについてはDELL EMC UNITY:REPLICATION TECHNOLOGIES A Detailed Review P.24~P.25「FAILOVER WITH SYNC, FAILOVER, AND FAILBACK」セクションに説明があります。
FYI:試験している時に道連れ(?)でブロックの同期レプリケーションもダウンしたのですが、この検知には1分31秒かかりました。
2017年9月28日 00:00
Uehara Y.さん
実機検証をして頂き誠に有り難うございます!
留意点なども記載くださり大変参考になりました。
デル サポート リソース
もっと見る
すべて表示
Top
Uehara Y.
Community Manager
Community Manager
•
5.1K メッセージ
0
2017年9月27日 01:00
CamoMileさん
死活確認の仕様については公開されているものがなかったので、実機を利用して確認してみました。
具体的には、筐体間非同期レプリケーション(File)を行っているUnityのネットワークインタフェースをダウンさせ、どれくらいでレプリケーションがその問題(通信不可能)に気が付くのかの確認を行いました。
結果はファイルレプリケーションを開始してすぐ(1秒程度)で通信不可能に気が付きました。これは実際に自分のハードウェア(SPのネットワークインタフェース)に問題があるために検知が早いという可能性が高いですが、もしもネットワーク側のIPスイッチ等に問題があった場合でも、数秒から数十秒で検知するものと考えられます。
ただ、その検知までにかかる時間よりも重要なことは、実際にUnity筐体間でデータのやり取りを始めるまでは異常に気が付かないという点です。
今回も意図的に同期を開始させたレプリケーションセッションはネットワークインタフェースの異常を検知した一方で、RPOの設定が長く、実際にデータのやり取りを行っていないレプリケーションセッションは正常ステータスのままであるという動きをしていました(OE4.2です)。
また、参考情報ですがレプリケーションに問題が発生した際にUnityは自動でフェイルオーバーは行いません。
誰かが明示的にフェイルオーバーの命令をUnityに対して行う必要があるのですが、レプリケーションソースに対してその命令を行う場合(Planned failover)と、レプリケーションターゲットに対して行う場合(Unplanned failover)で動作が異なる点にご注意ください。(まぁ実際の障害発生時にはターゲット側から命令発行を行うUnplanned failoverしか実施できないので悩むことはなさそうですが)
このPlannedとUnplanned failoverの動作の違いについてはDELL EMC UNITY:REPLICATION TECHNOLOGIES A Detailed Review P.24~P.25「FAILOVER WITH SYNC, FAILOVER, AND FAILBACK」セクションに説明があります。
FYI:試験している時に道連れ(?)でブロックの同期レプリケーションもダウンしたのですが、この検知には1分31秒かかりました。
CamoMile
1 Rookie
1 Rookie
•
20 メッセージ
0
2017年9月28日 00:00
Uehara Y.さん
実機検証をして頂き誠に有り難うございます!
留意点なども記載くださり大変参考になりました。