Hvordan implementere SBD STONITH i Linux-klynger

Résumé: Hensikten med denne artikkelen er å forklare hvordan Storage-Based Death (SBD) STONITH fungerer og hvordan du implementerer det i et flerbanemiljø.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Instructions

STONIT: "Skyt den andre noden i hodet" eller "Skyt den fornærmende noden i hodet"
Eller
STONITH: "Skyt det andre medlemmet eller maskinen i hodet"

STONITH er en teknikk for fekting i dataklynger. Fekting er isolering av en mislykket node slik at den ikke forårsaker forstyrrelser i en dataklynge.

I SBD STONITH holder nodene i Linux-klyngen hverandre oppdatert ved hjelp av hjerteslag-mekanismen. Hvis noe går galt med en node i klyngen, skrives en giftpille for den noden til den delte lagringsenheten. Noden må spise (akseptere) giftpillen og avslutte seg selv. Deretter kan en filsystemressurs trygt feiles over til en annen node i Linux-klyngen.

I et DELL-miljø blir alle diskene flerbanet. Dette inkluderer SBD STONITH-enheten. Når du oppretter SBD STONITH-enheten, må tidsavbruddene SBD bruker justeres, da følgende kan forårsake forsinkelser; MPIO-bane (multiple Path I/O's) bane ned-gjenkjenning, PowerPath-bane ned-gjenkjenning eller NMP-bane ned-gjenkjenning. Hvis du har flere enheter, vil ikke midlertidige tidsavbrudd for én enkelt enhet ha negativ innvirkning på SBD. Men hvis de alle går gjennom de samme FC-bryterne, må du gjøre dette. Watchdog timeout er tiden som kreves for å oppdage en banefeil og bytte til en annen bane. Etter at msgwait tidsavbrudd, antas meldingen å ha blitt levert til noden. For multipath, bør dette være tiden som kreves for multipathing å oppdage en banefeil og bytte til neste bane, lagt til tiden mellom to løkker for å få tilgang til SBD-enheten (standardintervallet mellom to løkker er 1 s).

Vakthundens tidsavbrudd må være kortere enn msgwait Tidsavbrudd – halvparten av verdien er en god verdi å bruke.

Standardverdien for msgwait Timeout er 10 s. Hvis msgwait Tidsavbrudd er ikke justert. Dette er for kort til å gi tid til en vert som har et problem på en bane ved tilgang til SBD-enheten for å oppdage at banen er dårlig og failover til en annen bane. Hvis verten ikke kan oppdatere vakthundtimeren raskt nok, skrives en giftpille til verten. Dette fører til at verten begår selvmord når den kan få tilgang til SBD-enheten igjen, noe som ikke er hensikten med STONITH-mekanismen.

Du angir disse verdiene ved å legge til -4 msgwait -1 watchdogtimeout til kommandoen Opprett.
Her er et eksempel på et ESX-miljø som bruker NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Her er et eksempel på et Linux-miljø som bruker PowerPath eller MPIO (med devloss tmo satt til 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alle tidsavbrudd er i sekunder.)

Informations supplémentaires

Dette problemet kan medføre betydelige forsinkelser som må feile. Hvis du vil ha mer informasjon om SBD STONITH, kan du merke av SUSE lagringsbeskyttelse og SBD (ekstern lenke)

Produits concernés

PowerPath/VE for VMware

Produits

PowerPath/VE for VMware
Propriétés de l’article
Numéro d’article: 000022740
Type d’article: How To
Dernière modification: 17 Apr 2026
Version:  7
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.