Hur man implementerar SBD STONITH i Linux-kluster

Résumé: Syftet med den här artikeln är att förklara hur Storage-Based Death (SBD) STONITH fungerar och hur man implementerar det i en miljö med flera sökvägar.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Instructions

STONITH: "Skjut den andra noden i huvudet" eller "Skjut den felande noden i huvudet"
eller
STONITH: "Skjut den andra medlemmen eller maskinen i huvudet"

STONITH är en teknik för fäktning i datorkluster. Fäktning är isoleringen av en misslyckad nod så att den inte orsakar störningar i ett datorkluster.

I SBD STONITH håller noderna i Linux-klustret varandra uppdaterade med hjälp av pulsslagsmekanismen. Om något går fel med en nod i klustret skrivs ett giftpiller för noden till den delade lagringsenheten. Noden måste äta (acceptera) giftpillret och göra slut på sig själv. Därefter kan en filsystemresurs på ett säkert sätt växlas över till en annan nod i Linux-klustret.

I en DELL-miljö har alla diskar flera sökvägar. Detta inkluderar SBD STONITH-enheten. Följaktligen, när du skapar SBD STONITH-enheten, måste de tidsgränser som SBD använder justeras eftersom följande kan orsaka fördröjningar; MPIO-identifiering (Multiple Path I/O) för detektering av nedgående sökväg, PowerPath nedåtdetektering eller NMP-identifiering för nedsteg. Om du har flera enheter påverkar tillfälliga tidsgränser för en enda enhet inte SBD negativt. Men om de alla går igenom samma FC-switchar måste du göra detta. Tidsgränsen för watchdog är den tid som krävs för att identifiera ett sökvägsfel och växla till en annan sökväg. Efter msgwait timeout antas meddelandet ha levererats till noden. För multipath bör detta vara den tid som krävs för multipathing för att upptäcka ett sökvägsfel och växla till nästa sökväg, plus tiden mellan två loopar för att komma åt SBD-enheten (standardintervallet mellan två loopar är 1 s).

Tidsgränsen för watchdog måste vara kortare än msgwait Timeout – Halva värdet är ett bra värde att använda.

Standardvärdet för msgwait Timeout är 10 s. Om den msgwait Timeouten justeras inte, detta är för kort för att ge tid till en värd som har problem med en sökväg vid åtkomst till SBD-enheten för att upptäcka att sökvägen är felaktig och för att redundansväxla till en annan sökväg. Om värden inte kan uppdatera övervakningstimern tillräckligt snabbt skrivs ett giftpiller till värden. Detta gör att värden begår självmord när den kan komma åt SBD-enheten igen, vilket inte är syftet med STONITH-mekanismen.

Du anger dessa värden genom att lägga till -4 msgwait -1 watchdogtimeout till kommandot create.
Här är ett exempel på en ESX-miljö som använder NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Här är ett exempel på en Linux-miljö som använder PowerPath eller MPIO (med devloss tmo inställd på 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alla tidsgränser anges i sekunder.)

Informations supplémentaires

Det här problemet kan medföra betydande fördröjningar vid redundans. Mer information om SBD STONITH finns i SUSE Storage Protection och SBD (Extern länk)

Produits concernés

PowerPath/VE for VMware

Produits

PowerPath/VE for VMware
Propriétés de l’article
Numéro d’article: 000022740
Type d’article: How To
Dernière modification: 17 Apr 2026
Version:  7
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.