Hur man implementerar SBD STONITH i Linux-kluster

Summary: Syftet med den här artikeln är att förklara hur Storage-Based Death (SBD) STONITH fungerar och hur man implementerar det i en miljö med flera sökvägar.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

STONITH: "Skjut den andra noden i huvudet" eller "Skjut den felande noden i huvudet"
eller
STONITH: "Skjut den andra medlemmen eller maskinen i huvudet"

STONITH är en teknik för fäktning i datorkluster. Fäktning är isoleringen av en misslyckad nod så att den inte orsakar störningar i ett datorkluster.

I SBD STONITH håller noderna i Linux-klustret varandra uppdaterade med hjälp av pulsslagsmekanismen. Om något går fel med en nod i klustret skrivs ett giftpiller för noden till den delade lagringsenheten. Noden måste äta (acceptera) giftpillret och göra slut på sig själv. Därefter kan en filsystemresurs på ett säkert sätt växlas över till en annan nod i Linux-klustret.

I en DELL-miljö har alla diskar flera sökvägar. Detta inkluderar SBD STONITH-enheten. Följaktligen, när du skapar SBD STONITH-enheten, måste de tidsgränser som SBD använder justeras eftersom följande kan orsaka fördröjningar; MPIO-identifiering (Multiple Path I/O) för detektering av nedgående sökväg, PowerPath nedåtdetektering eller NMP-identifiering för nedsteg. Om du har flera enheter påverkar tillfälliga tidsgränser för en enda enhet inte SBD negativt. Men om de alla går igenom samma FC-switchar måste du göra detta. Tidsgränsen för watchdog är den tid som krävs för att identifiera ett sökvägsfel och växla till en annan sökväg. Efter msgwait timeout antas meddelandet ha levererats till noden. För multipath bör detta vara den tid som krävs för multipathing för att upptäcka ett sökvägsfel och växla till nästa sökväg, plus tiden mellan två loopar för att komma åt SBD-enheten (standardintervallet mellan två loopar är 1 s).

Tidsgränsen för watchdog måste vara kortare än msgwait Timeout – Halva värdet är ett bra värde att använda.

Standardvärdet för msgwait Timeout är 10 s. Om den msgwait Timeouten justeras inte, detta är för kort för att ge tid till en värd som har problem med en sökväg vid åtkomst till SBD-enheten för att upptäcka att sökvägen är felaktig och för att redundansväxla till en annan sökväg. Om värden inte kan uppdatera övervakningstimern tillräckligt snabbt skrivs ett giftpiller till värden. Detta gör att värden begår självmord när den kan komma åt SBD-enheten igen, vilket inte är syftet med STONITH-mekanismen.

Du anger dessa värden genom att lägga till -4 msgwait -1 watchdogtimeout till kommandot create.
Här är ett exempel på en ESX-miljö som använder NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Här är ett exempel på en Linux-miljö som använder PowerPath eller MPIO (med devloss tmo inställd på 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alla tidsgränser anges i sekunder.)

Additional Information

Det här problemet kan medföra betydande fördröjningar vid redundans. Mer information om SBD STONITH finns i SUSE Storage Protection och SBD (Extern länk)

Affected Products

PowerPath/VE for VMware

Products

PowerPath/VE for VMware
Article Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.