SBD STONITH implementeren in Linux-clusters
Samenvatting: Het doel van dit artikel is om uit te leggen hoe Storage-Based Death (SBD) STONITH werkt en hoe het te implementeren in een multipathing omgeving.
Dit artikel is van toepassing op
Dit artikel is niet van toepassing op
Dit artikel is niet gebonden aan een specifiek product.
Niet alle productversies worden in dit artikel vermeld.
Instructies
STONITH: "Schiet de andere node in het hoofd" of "Schiet de aanstootgevende node in het hoofd"
Of
STONITH: "Schiet het andere lid of de machine in het hoofd"
STONITH is een techniek voor het schermen in computerclusters. Fencing is het isoleren van een defect knooppunt, zodat het geen verstoring van een computercluster veroorzaakt.
In SBD STONITH houden de nodes in het Linux-cluster elkaar up-to-date met behulp van het Heartbeat-mechanisme. Als er iets misgaat met een knooppunt in het cluster, wordt er voor dat knooppunt een gifpil weggeschreven naar het gedeelde opslagapparaat. De node moet de gifpil eten (accepteren) en zichzelf beëindigen. Waarna een bestandssysteembron veilig kan worden overgezet naar een ander knooppunt in het Linux-cluster.
In een DELL-omgeving zijn alle schijven multipathed. Dit geldt ook voor het SBD STONITH-apparaat. Bijgevolg moeten bij het maken van het SBD STONITH-apparaat de time-outs die SBD gebruikt worden aangepast, omdat het volgende vertragingen kan veroorzaken; Meerdere Path I/O's (MPIO) path down-detectie, PowerPath-path-downdetectie of NMP-path-down-detectie. Als u meerdere apparaten hebt, hebben tijdelijke time-outs van één apparaat geen negatieve invloed op SBD. Als ze echter allemaal door dezelfde FC-schakelaars gaan, moet u dit doen. De time-out van de watchdog is de tijd die nodig is om een padfout te detecteren en over te schakelen naar een ander pad. Nadat het bericht
De time-out van de watchdog moet korter zijn dan de
De standaardwaarde van de
U stelt deze waarden in door
Hier volgt een voorbeeld van een ESX-omgeving die gebruikmaakt van NMP:
Hier volgt een voorbeeld van een Linux-omgeving met PowerPath of MPIO (met
(Alle time-outs zijn in seconden.)
Of
STONITH: "Schiet het andere lid of de machine in het hoofd"
STONITH is een techniek voor het schermen in computerclusters. Fencing is het isoleren van een defect knooppunt, zodat het geen verstoring van een computercluster veroorzaakt.
In SBD STONITH houden de nodes in het Linux-cluster elkaar up-to-date met behulp van het Heartbeat-mechanisme. Als er iets misgaat met een knooppunt in het cluster, wordt er voor dat knooppunt een gifpil weggeschreven naar het gedeelde opslagapparaat. De node moet de gifpil eten (accepteren) en zichzelf beëindigen. Waarna een bestandssysteembron veilig kan worden overgezet naar een ander knooppunt in het Linux-cluster.
In een DELL-omgeving zijn alle schijven multipathed. Dit geldt ook voor het SBD STONITH-apparaat. Bijgevolg moeten bij het maken van het SBD STONITH-apparaat de time-outs die SBD gebruikt worden aangepast, omdat het volgende vertragingen kan veroorzaken; Meerdere Path I/O's (MPIO) path down-detectie, PowerPath-path-downdetectie of NMP-path-down-detectie. Als u meerdere apparaten hebt, hebben tijdelijke time-outs van één apparaat geen negatieve invloed op SBD. Als ze echter allemaal door dezelfde FC-schakelaars gaan, moet u dit doen. De time-out van de watchdog is de tijd die nodig is om een padfout te detecteren en over te schakelen naar een ander pad. Nadat het bericht
msgwait time-out, wordt aangenomen dat het bericht is afgeleverd bij het knooppunt. Voor multipath moet dit de tijd zijn die de multipath nodig heeft om een padfout te detecteren en over te schakelen naar het volgende pad, opgeteld bij de tijd tussen twee lussen om toegang te krijgen tot het SBD-apparaat (het standaardinterval tussen twee lussen is 1 s).
De time-out van de watchdog moet korter zijn dan de
msgwait Time-out - de helft van de waarde is een goede waarde om te gebruiken.
De standaardwaarde van de
msgwait Time-out is 10 seconden. Als de msgwait time-out is niet aangepast, dit is te kort om tijd te geven aan een host die een probleem heeft op een pad bij toegang tot het SBD-apparaat om te detecteren dat het pad slecht is en om failover uit te voeren naar een ander pad. Als de host de watchdog timer niet snel genoeg kan updaten, wordt er een gifpil naar de host geschreven. Dit zorgt ervoor dat de gastheer zelfmoord pleegt wanneer hij weer toegang heeft tot het SBD-apparaat, wat niet het doel is van het STONITH-mechanisme.
U stelt deze waarden in door
-4 msgwait -1 watchdogtimeout naar de opdracht create.
Hier volgt een voorbeeld van een ESX-omgeving die gebruikmaakt van NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Hier volgt een voorbeeld van een Linux-omgeving met PowerPath of MPIO (met
devloss tmo ingesteld op 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alle time-outs zijn in seconden.)
Extra informatie
Dit probleem kan aanzienlijke vertragingen veroorzaken als het gaat om failover. Kijk voor meer informatie over SBD STONITH op SUSE Storage Protection en SBD (Externe link)
Getroffen producten
PowerPath/VE for VMwareProducten
PowerPath/VE for VMwareArtikeleigenschappen
Artikelnummer: 000022740
Artikeltype: How To
Laatst aangepast: 22 aug. 2024
Versie: 6
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.