Jak implementovat SBD STONITH v linuxových clusterech

Samenvatting: Účelem tohoto článku je vysvětlit, jak funguje funkce Storage-Based Death (SBD) STONITH a jak ji implementovat v prostředí s více cestami.

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Instructies

STONITH: "Zastřel druhý uzel do hlavy" nebo "Zastřel urážlivý uzel do hlavy"
nebo
STONITH: "Zastřelte druhého člena nebo stroj do hlavy"

STONITH je technika pro šerm v počítačových clusterech. Oplocení je izolace vadného uzlu tak, aby nezpůsobil narušení počítačového clusteru.

V SBD STONITH se uzly v linuxovém clusteru navzájem aktualizují pomocí mechanismu prezenčního signálu. Pokud se něco pokazí s uzlem v clusteru, zapíše se pro tento uzel do sdíleného úložného zařízení jedovatá pilulka. Uzel musí sníst (přijmout) jedovatou pilulku a sám se ukončit. Poté lze prostředek systému souborů bezpečně převzít do jiného uzlu v clusteru Linux.

V prostředí DELL jsou všechny disky vícecestné. To zahrnuje zařízení SBD STONITH. V důsledku toho musí být při vytváření zařízení SBD STONITH upraveny časové limity, které SBD používá, protože následující mohou způsobit zpoždění; Detekce více cest I/O (MPIO), detekce cesty dolů PowerPath nebo detekce cesty dolů NMP. Pokud máte více zařízení, přechodné časové limity jednoho zařízení nemají negativní vliv na SBD. Pokud však všechny procházejí stejnými přepínači FC, musíte to udělat. Časový limit sledovacího zařízení je čas potřebný ke zjištění selhání cesty a přepnutí na jinou cestu. Poté, co msgwait časového limitu, předpokládá se, že zpráva byla doručena do uzlu. U vícenásobné cesty by to měla být doba potřebná k tomu, aby funkce Multipathing zjistila selhání cesty a přepnula na další cestu, připočtená k době mezi dvěma smyčkami pro přístup k zařízení SBD (výchozí interval mezi dvěma smyčkami je 1 s).

Časový limit sledovače musí být kratší než msgwait timeout – poloviční hodnota je dobrá hodnota.

Výchozí hodnota msgwait Časový limit je 10 s. V případě, že msgwait timeout není upraven, je příliš krátký na to, aby hostitel, který má problém s cestou při přístupu k zařízení SBD, měl čas zjistit, že cesta je špatná, a provést převzetí při selhání jinou cestou. Pokud hostitel nemůže aktualizovat časovač sledovacího zařízení dostatečně rychle, je hostiteli zapsána jedovatá pilulka. To způsobí, že hostitel spáchá sebevraždu, když má znovu přístup k zařízení SBD, což není účelem mechanismu STONITH.

Tyto hodnoty nastavíte přidáním -4 msgwait -1 watchdogtimeout na příkaz create.
Zde je příklad pro prostředí ESX, které používá NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Zde je příklad pro prostředí Linux, které používá PowerPath nebo MPIO (s devloss tmo nastaveno na 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Všechny časové limity jsou v sekundách.)

Extra informatie

Tento problém může způsobit významné zpoždění při převzetí služeb při selhání. Další informace o SBD STONITH najdete v článku SUSE Storage Protection a SBD (externí odkaz)

Getroffen producten

PowerPath/VE for VMware

Producten

PowerPath/VE for VMware
Artikeleigenschappen
Artikelnummer: 000022740
Artikeltype: How To
Laatst aangepast: 22 aug. 2024
Versie:  6
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.