Hur man implementerar SBD STONITH i Linux-kluster

Samenvatting: Syftet med den här artikeln är att förklara hur Storage-Based Death (SBD) STONITH fungerar och hur man implementerar det i en miljö med flera sökvägar.

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Instructies

STONITH: "Skjut den andra noden i huvudet" eller "Skjut den felande noden i huvudet"
eller
STONITH: "Skjut den andra medlemmen eller maskinen i huvudet"

STONITH är en teknik för fäktning i datorkluster. Fäktning är isoleringen av en misslyckad nod så att den inte orsakar störningar i ett datorkluster.

I SBD STONITH håller noderna i Linux-klustret varandra uppdaterade med hjälp av pulsslagsmekanismen. Om något går fel med en nod i klustret skrivs ett giftpiller för noden till den delade lagringsenheten. Noden måste äta (acceptera) giftpillret och göra slut på sig själv. Därefter kan en filsystemresurs på ett säkert sätt växlas över till en annan nod i Linux-klustret.

I en DELL-miljö har alla diskar flera sökvägar. Detta inkluderar SBD STONITH-enheten. Följaktligen, när du skapar SBD STONITH-enheten, måste de tidsgränser som SBD använder justeras eftersom följande kan orsaka fördröjningar; MPIO-identifiering (Multiple Path I/O) för detektering av nedgående sökväg, PowerPath nedåtdetektering eller NMP-identifiering för nedsteg. Om du har flera enheter påverkar tillfälliga tidsgränser för en enda enhet inte SBD negativt. Men om de alla går igenom samma FC-switchar måste du göra detta. Tidsgränsen för watchdog är den tid som krävs för att identifiera ett sökvägsfel och växla till en annan sökväg. Efter msgwait timeout antas meddelandet ha levererats till noden. För multipath bör detta vara den tid som krävs för multipathing för att upptäcka ett sökvägsfel och växla till nästa sökväg, plus tiden mellan två loopar för att komma åt SBD-enheten (standardintervallet mellan två loopar är 1 s).

Tidsgränsen för watchdog måste vara kortare än msgwait Timeout – Halva värdet är ett bra värde att använda.

Standardvärdet för msgwait Timeout är 10 s. Om den msgwait Timeouten justeras inte, detta är för kort för att ge tid till en värd som har problem med en sökväg vid åtkomst till SBD-enheten för att upptäcka att sökvägen är felaktig och för att redundansväxla till en annan sökväg. Om värden inte kan uppdatera övervakningstimern tillräckligt snabbt skrivs ett giftpiller till värden. Detta gör att värden begår självmord när den kan komma åt SBD-enheten igen, vilket inte är syftet med STONITH-mekanismen.

Du anger dessa värden genom att lägga till -4 msgwait -1 watchdogtimeout till kommandot create.
Här är ett exempel på en ESX-miljö som använder NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Här är ett exempel på en Linux-miljö som använder PowerPath eller MPIO (med devloss tmo inställd på 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alla tidsgränser anges i sekunder.)

Extra informatie

Det här problemet kan medföra betydande fördröjningar vid redundans. Mer information om SBD STONITH finns i SUSE Storage Protection och SBD (Extern länk)

Getroffen producten

PowerPath/VE for VMware

Producten

PowerPath/VE for VMware
Artikeleigenschappen
Artikelnummer: 000022740
Artikeltype: How To
Laatst aangepast: 22 aug. 2024
Versie:  6
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.