Sådan implementeres SBD STONITH i Linux-klynger

Summary: Formålet med denne artikel er at forklare, hvordan Storage-Based Death (SBD) STONITH fungerer, og hvordan man implementerer det i et multipathing-miljø.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

STONITH: "Skyd den anden knude i hovedet" eller "Skyd den fornærmende knude i hovedet"
Eller
STONITH: "Skyd det andet medlem eller maskine i hovedet"

STONITH er en teknik til hegn i computerklynger. Hegn er isolering af en mislykket node, så den ikke forårsager forstyrrelse af en computerklynge.

I SBD STONITH holder noderne i Linux-klyngen hinanden opdateret ved hjælp af Heartbeat-mekanismen. Hvis noget går galt med en node i klyngen, skrives en giftpille til den knude til den delte lagerenhed. Knuden skal spise (acceptere) giftpillen og afslutte sig selv. Derefter kan en filsystemressource sikkert mislykkes til en anden node i Linux-klyngen.

I et DELL-miljø er alle diske multipathed. Dette omfatter SBD STONITH-enheden. Når du opretter SBD STONITH-enheden, skal timeouts, som SBD bruger, derfor justeres, da følgende kan forårsage forsinkelser. Registrering af flere Sti I/O'er (MPIO) sti ned, registrering af PowerPath-sti ned eller registrering af NMP-sti ned. Hvis du har flere enheder, påvirker midlertidige timeouts for en enkelt enhed ikke SBD negativt. Men hvis de alle gennemgår de samme FC-switche, skal du gøre dette. Timeout for vagthunden er den tid, der kræves for at registrere en stifejl og skifte til en anden sti. Efter msgwait timeout, antages meddelelsen at være leveret til noden. For multipath skal dette være den tid, det tager multipathing at registrere en stifejl og skifte til den næste sti, tilføjet til tiden mellem to sløjfer for at få adgang til SBD-enheden (standardintervallet mellem to sløjfer er 1 s).

Timeout for vagthunden skal være kortere end msgwait Timeout – halvdelen af værdien er god værdi at bruge.

Standardværdien for msgwait Timeout er 10 sek. Hvis ikonet msgwait Timeout justeres ikke. Dette er for kort til at give tid til, at en vært, der har et problem på en sti, når de åbner SBD-enheden, kan registrere, at stien er dårlig, og failover til en anden sti. Hvis værten ikke kan opdatere vagthundens timer hurtigt nok, skrives en giftpille til værten. Dette får værten til at begå selvmord, når den kan få adgang til SBD-enheden igen, hvilket ikke er formålet med STONITH-mekanismen.

Du kan angive disse værdier ved at tilføje -4 msgwait -1 watchdogtimeout til kommandoen Opret.
Her er et eksempel på et ESX-miljø, der bruger NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Her er et eksempel på et Linux-miljø, der bruger PowerPath eller MPIO (med devloss tmo indstillet til 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alle timeouts er på få sekunder.)

Additional Information

Dette problem kan medføre betydelige forsinkelser for at mislykkes. Du kan finde flere oplysninger om SBD STONITH under SUSE Storage Protection og SBD (Eksternt link)

Affected Products

PowerPath/VE for VMware

Products

PowerPath/VE for VMware
Article Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.