LinuxクラスターでSBD STONITHを実装する方法
概要: この記事の目的は、Storage-Based Death (SBD) STONITHの仕組みと、マルチパス環境での実装方法を説明することです。
この記事は次に適用されます:
この記事は次には適用されません:
この記事は、特定の製品に関連付けられていません。
すべての製品パージョンがこの記事に記載されているわけではありません。
手順
ストーニス: "Shoot The Other Node In The Head" または "Shoot The Offending Node In The Head"
または
STONITH: 「Shoot The Other Member or Machine In The Head」
STONITHは、コンピュータクラスタでフェンシングを行うための技術です。フェンシングは、障害が発生したノードを隔離することで、コンピューター クラスターの中断を引き起こさないようにすることです
SBD STONITHでは、Linuxクラスター内のノードは、ハートビート メカニズムを使用して相互にアップデートされます。クラスター内のノードで問題が発生した場合、そのノードのポイズン ピルが共有ストレージ デバイスに書き込まれます。ノードはポイズン ピルを食べて(受け入れて)終了する必要があります。その後、ファイル システム リソースをLinuxクラスター内の別のノードに安全にフェールオーバーできます。
Dell環境では、すべてのディスクがマルチパス化されています。これには、SBD STONITHデバイスが含まれます。その結果、SBD STONITHデバイスを作成するときは、次のことが遅延を引き起こす可能性があるため、SBDが使用するタイムアウトを調整する必要があります。複数パスI/O(MPIO)のパス ダウン検出、PowerPathパス ダウン検出、またはNMPパス ダウン検出。複数のデバイスがある場合、1台のデバイスの一時的なタイムアウトはSBDに悪影響を与えません。ただし、それらがすべて同じFCスイッチを経由する場合は、これを行う必要があります。ウォッチドッグ タイムアウトは、パス障害を検出し、別のパスに切り替えるのに必要な時間です。その後、
ウォッチドッグ タイムアウトは、
のデフォルト値は
これらの値を設定するには、
NMPを使用しているESX環境の例を次に示します。
ここでは、PowerPathまたはMPIO(
(タイムアウトはすべて秒単位です)。
または
STONITH: 「Shoot The Other Member or Machine In The Head」
STONITHは、コンピュータクラスタでフェンシングを行うための技術です。フェンシングは、障害が発生したノードを隔離することで、コンピューター クラスターの中断を引き起こさないようにすることです
SBD STONITHでは、Linuxクラスター内のノードは、ハートビート メカニズムを使用して相互にアップデートされます。クラスター内のノードで問題が発生した場合、そのノードのポイズン ピルが共有ストレージ デバイスに書き込まれます。ノードはポイズン ピルを食べて(受け入れて)終了する必要があります。その後、ファイル システム リソースをLinuxクラスター内の別のノードに安全にフェールオーバーできます。
Dell環境では、すべてのディスクがマルチパス化されています。これには、SBD STONITHデバイスが含まれます。その結果、SBD STONITHデバイスを作成するときは、次のことが遅延を引き起こす可能性があるため、SBDが使用するタイムアウトを調整する必要があります。複数パスI/O(MPIO)のパス ダウン検出、PowerPathパス ダウン検出、またはNMPパス ダウン検出。複数のデバイスがある場合、1台のデバイスの一時的なタイムアウトはSBDに悪影響を与えません。ただし、それらがすべて同じFCスイッチを経由する場合は、これを行う必要があります。ウォッチドッグ タイムアウトは、パス障害を検出し、別のパスに切り替えるのに必要な時間です。その後、
msgwait タイムアウトの場合、メッセージはノードに配信されたと見なされます。マルチパスの場合、これは、マルチパスがパス障害を検出して次のパスに切り替えるのに必要な時間に、SBDデバイスにアクセスするための2つのループ間の時間を追加する必要があります(2つのループ間のデフォルトの間隔は1秒です)。
ウォッチドッグ タイムアウトは、
msgwait timeout - 値の半分は使用するのに適した値です。
のデフォルト値は
msgwait タイムアウトは10秒です。もし msgwait タイムアウトは調整されません。これは、SBDデバイスにアクセスする際にパス上で問題が発生しているホストがパスに不正であることを検出し、別のパスにフェールオーバーする時間を与えるには短すぎます。ホストがウォッチドッグ タイマーを十分な速さでアップデートできない場合は、 ポイズン ピルがホストに書き込まれます。これにより、ホストはSBDデバイスに再びアクセスできるときに自殺しますが、 これはSTONITHメカニズムの目的ではありません
これらの値を設定するには、
-4 msgwait -1 watchdogtimeout create コマンドに追加します
NMPを使用しているESX環境の例を次に示します。
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
ここでは、PowerPathまたはMPIO(
devloss tmo 30に設定します)。
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(タイムアウトはすべて秒単位です)。
その他の情報
この問題により、フェールオーバーに大幅な遅延が発生する可能性があります。SBD STONITHの詳細については、「SUSE Storage ProtectionとSBD」(外部リンク)を参照してください。
対象製品
PowerPath/VE for VMware製品
PowerPath/VE for VMware文書のプロパティ
文書番号: 000022740
文書の種類: How To
最終更新: 17 4月 2026
バージョン: 7
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。