Jak implementovat SBD STONITH v linuxových clusterech

Summary: Účelem tohoto článku je vysvětlit, jak funguje funkce Storage-Based Death (SBD) STONITH a jak ji implementovat v prostředí s více cestami.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

STONITH: "Zastřel druhý uzel do hlavy" nebo "Zastřel urážlivý uzel do hlavy"
nebo
STONITH: "Zastřelte druhého člena nebo stroj do hlavy"

STONITH je technika pro šerm v počítačových clusterech. Oplocení je izolace vadného uzlu tak, aby nezpůsobil narušení počítačového clusteru.

V SBD STONITH se uzly v linuxovém clusteru navzájem aktualizují pomocí mechanismu prezenčního signálu. Pokud se něco pokazí s uzlem v clusteru, zapíše se pro tento uzel do sdíleného úložného zařízení jedovatá pilulka. Uzel musí sníst (přijmout) jedovatou pilulku a sám se ukončit. Poté lze prostředek systému souborů bezpečně převzít do jiného uzlu v clusteru Linux.

V prostředí DELL jsou všechny disky vícecestné. To zahrnuje zařízení SBD STONITH. V důsledku toho musí být při vytváření zařízení SBD STONITH upraveny časové limity, které SBD používá, protože následující mohou způsobit zpoždění; Detekce více cest I/O (MPIO), detekce cesty dolů PowerPath nebo detekce cesty dolů NMP. Pokud máte více zařízení, přechodné časové limity jednoho zařízení nemají negativní vliv na SBD. Pokud však všechny procházejí stejnými přepínači FC, musíte to udělat. Časový limit sledovacího zařízení je čas potřebný ke zjištění selhání cesty a přepnutí na jinou cestu. Poté, co msgwait časového limitu, předpokládá se, že zpráva byla doručena do uzlu. U vícenásobné cesty by to měla být doba potřebná k tomu, aby funkce Multipathing zjistila selhání cesty a přepnula na další cestu, připočtená k době mezi dvěma smyčkami pro přístup k zařízení SBD (výchozí interval mezi dvěma smyčkami je 1 s).

Časový limit sledovače musí být kratší než msgwait timeout – poloviční hodnota je dobrá hodnota.

Výchozí hodnota msgwait Časový limit je 10 s. V případě, že msgwait timeout není upraven, je příliš krátký na to, aby hostitel, který má problém s cestou při přístupu k zařízení SBD, měl čas zjistit, že cesta je špatná, a provést převzetí při selhání jinou cestou. Pokud hostitel nemůže aktualizovat časovač sledovacího zařízení dostatečně rychle, je hostiteli zapsána jedovatá pilulka. To způsobí, že hostitel spáchá sebevraždu, když má znovu přístup k zařízení SBD, což není účelem mechanismu STONITH.

Tyto hodnoty nastavíte přidáním -4 msgwait -1 watchdogtimeout na příkaz create.
Zde je příklad pro prostředí ESX, které používá NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Zde je příklad pro prostředí Linux, které používá PowerPath nebo MPIO (s devloss tmo nastaveno na 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Všechny časové limity jsou v sekundách.)

Additional Information

Tento problém může způsobit významné zpoždění při převzetí služeb při selhání. Další informace o SBD STONITH najdete v článku SUSE Storage Protection a SBD (externí odkaz)

Affected Products

PowerPath/VE for VMware

Products

PowerPath/VE for VMware
Article Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.