SBD STONITH implementeren in Linux-clusters
Summary: Het doel van dit artikel is om uit te leggen hoe Storage-Based Death (SBD) STONITH werkt en hoe het te implementeren in een multipathing omgeving.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
STONITH: "Schiet de andere node in het hoofd" of "Schiet de aanstootgevende node in het hoofd"
Of
STONITH: "Schiet het andere lid of de machine in het hoofd"
STONITH is een techniek voor het schermen in computerclusters. Fencing is het isoleren van een defect knooppunt, zodat het geen verstoring van een computercluster veroorzaakt.
In SBD STONITH houden de nodes in het Linux-cluster elkaar up-to-date met behulp van het Heartbeat-mechanisme. Als er iets misgaat met een knooppunt in het cluster, wordt er voor dat knooppunt een gifpil weggeschreven naar het gedeelde opslagapparaat. De node moet de gifpil eten (accepteren) en zichzelf beëindigen. Waarna een bestandssysteembron veilig kan worden overgezet naar een ander knooppunt in het Linux-cluster.
In een DELL-omgeving zijn alle schijven multipathed. Dit geldt ook voor het SBD STONITH-apparaat. Bijgevolg moeten bij het maken van het SBD STONITH-apparaat de time-outs die SBD gebruikt worden aangepast, omdat het volgende vertragingen kan veroorzaken; Meerdere Path I/O's (MPIO) path down-detectie, PowerPath-path-downdetectie of NMP-path-down-detectie. Als u meerdere apparaten hebt, hebben tijdelijke time-outs van één apparaat geen negatieve invloed op SBD. Als ze echter allemaal door dezelfde FC-schakelaars gaan, moet u dit doen. De time-out van de watchdog is de tijd die nodig is om een padfout te detecteren en over te schakelen naar een ander pad. Nadat het bericht
De time-out van de watchdog moet korter zijn dan de
De standaardwaarde van de
U stelt deze waarden in door
Hier volgt een voorbeeld van een ESX-omgeving die gebruikmaakt van NMP:
Hier volgt een voorbeeld van een Linux-omgeving met PowerPath of MPIO (met
(Alle time-outs zijn in seconden.)
Of
STONITH: "Schiet het andere lid of de machine in het hoofd"
STONITH is een techniek voor het schermen in computerclusters. Fencing is het isoleren van een defect knooppunt, zodat het geen verstoring van een computercluster veroorzaakt.
In SBD STONITH houden de nodes in het Linux-cluster elkaar up-to-date met behulp van het Heartbeat-mechanisme. Als er iets misgaat met een knooppunt in het cluster, wordt er voor dat knooppunt een gifpil weggeschreven naar het gedeelde opslagapparaat. De node moet de gifpil eten (accepteren) en zichzelf beëindigen. Waarna een bestandssysteembron veilig kan worden overgezet naar een ander knooppunt in het Linux-cluster.
In een DELL-omgeving zijn alle schijven multipathed. Dit geldt ook voor het SBD STONITH-apparaat. Bijgevolg moeten bij het maken van het SBD STONITH-apparaat de time-outs die SBD gebruikt worden aangepast, omdat het volgende vertragingen kan veroorzaken; Meerdere Path I/O's (MPIO) path down-detectie, PowerPath-path-downdetectie of NMP-path-down-detectie. Als u meerdere apparaten hebt, hebben tijdelijke time-outs van één apparaat geen negatieve invloed op SBD. Als ze echter allemaal door dezelfde FC-schakelaars gaan, moet u dit doen. De time-out van de watchdog is de tijd die nodig is om een padfout te detecteren en over te schakelen naar een ander pad. Nadat het bericht
msgwait time-out, wordt aangenomen dat het bericht is afgeleverd bij het knooppunt. Voor multipath moet dit de tijd zijn die de multipath nodig heeft om een padfout te detecteren en over te schakelen naar het volgende pad, opgeteld bij de tijd tussen twee lussen om toegang te krijgen tot het SBD-apparaat (het standaardinterval tussen twee lussen is 1 s).
De time-out van de watchdog moet korter zijn dan de
msgwait Time-out - de helft van de waarde is een goede waarde om te gebruiken.
De standaardwaarde van de
msgwait Time-out is 10 seconden. Als de msgwait time-out is niet aangepast, dit is te kort om tijd te geven aan een host die een probleem heeft op een pad bij toegang tot het SBD-apparaat om te detecteren dat het pad slecht is en om failover uit te voeren naar een ander pad. Als de host de watchdog timer niet snel genoeg kan updaten, wordt er een gifpil naar de host geschreven. Dit zorgt ervoor dat de gastheer zelfmoord pleegt wanneer hij weer toegang heeft tot het SBD-apparaat, wat niet het doel is van het STONITH-mechanisme.
U stelt deze waarden in door
-4 msgwait -1 watchdogtimeout naar de opdracht create.
Hier volgt een voorbeeld van een ESX-omgeving die gebruikmaakt van NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Hier volgt een voorbeeld van een Linux-omgeving met PowerPath of MPIO (met
devloss tmo ingesteld op 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Alle time-outs zijn in seconden.)
Additional Information
Dit probleem kan aanzienlijke vertragingen veroorzaken als het gaat om failover. Kijk voor meer informatie over SBD STONITH op SUSE Storage Protection en SBD (Externe link)
Affected Products
PowerPath/VE for VMwareProducts
PowerPath/VE for VMwareArticle Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.