LinuxクラスターでSBD STONITHを実装する方法

Riepilogo: この記事の目的は、Storage-Based Death (SBD) STONITHの仕組みと、マルチパス環境での実装方法を説明することです。

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Istruzioni

ストーニス: "Shoot The Other Node In The Head" または "Shoot The Offending Node In The Head"
または
STONITH: 「Shoot The Other Member or Machine In The Head」

STONITHは、コンピュータクラスタでフェンシングを行うための技術です。フェンシングは、障害が発生したノードを隔離することで、コンピューター クラスターの中断を引き起こさないようにすることです

SBD STONITHでは、Linuxクラスター内のノードは、ハートビート メカニズムを使用して相互にアップデートされます。クラスター内のノードで問題が発生した場合、そのノードのポイズン ピルが共有ストレージ デバイスに書き込まれます。ノードはポイズン ピルを食べて(受け入れて)終了する必要があります。その後、ファイル システム リソースをLinuxクラスター内の別のノードに安全にフェールオーバーできます。

Dell環境では、すべてのディスクがマルチパス化されています。これには、SBD STONITHデバイスが含まれます。その結果、SBD STONITHデバイスを作成するときは、次のことが遅延を引き起こす可能性があるため、SBDが使用するタイムアウトを調整する必要があります。複数パスI/O(MPIO)のパス ダウン検出、PowerPathパス ダウン検出、またはNMPパス ダウン検出。複数のデバイスがある場合、1台のデバイスの一時的なタイムアウトはSBDに悪影響を与えません。ただし、それらがすべて同じFCスイッチを経由する場合は、これを行う必要があります。ウォッチドッグ タイムアウトは、パス障害を検出し、別のパスに切り替えるのに必要な時間です。その後、 msgwait タイムアウトの場合、メッセージはノードに配信されたと見なされます。マルチパスの場合、これは、マルチパスがパス障害を検出して次のパスに切り替えるのに必要な時間に、SBDデバイスにアクセスするための2つのループ間の時間を追加する必要があります(2つのループ間のデフォルトの間隔は1秒です)。

ウォッチドッグ タイムアウトは、 msgwait timeout - 値の半分は使用するのに適した値です。

のデフォルト値は msgwait タイムアウトは10秒です。もし msgwait タイムアウトは調整されません。これは、SBDデバイスにアクセスする際にパス上で問題が発生しているホストがパスに不正であることを検出し、別のパスにフェールオーバーする時間を与えるには短すぎます。ホストがウォッチドッグ タイマーを十分な速さでアップデートできない場合は、 ポイズン ピルがホストに書き込まれます。これにより、ホストはSBDデバイスに再びアクセスできるときに自殺しますが、 これはSTONITHメカニズムの目的ではありません

これらの値を設定するには、 -4 msgwait -1 watchdogtimeout create コマンドに追加します
NMPを使用しているESX環境の例を次に示します。
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
ここでは、PowerPathまたはMPIO( devloss tmo 30に設定します)。
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(タイムアウトはすべて秒単位です)。

Informazioni aggiuntive

この問題により、フェールオーバーに大幅な遅延が発生する可能性があります。SBD STONITHの詳細については、「SUSE Storage ProtectionとSBD」(外部リンク)を参照してください。

Prodotti interessati

PowerPath/VE for VMware

Prodotti

PowerPath/VE for VMware
Proprietà dell'articolo
Numero articolo: 000022740
Tipo di articolo: How To
Ultima modifica: 22 ago 2024
Versione:  6
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.