SBD STONITHIN käyttöönotto Linux-klustereissa

Summary: Tämän artikkelin tarkoituksena on selittää, miten Storage-Based Death (SBD) STONITH toimii ja miten se voidaan toteuttaa monipolkuympäristössä.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

STONITH: "Ammu toinen solmu päähän" tai "Ammu loukkaava solmu päähän"
Tai
STONITH: "Ammu toinen jäsen tai kone päähän"

STONITH on tekniikka aitaamiseen tietokoneklustereissa. Aitaus on epäonnistuneen solmun eristäminen siten, että se ei aiheuta häiriöitä tietokoneklusterille.

SBD STONITHissa Linux-klusterin solmut pitävät toisensa ajan tasalla Heartbeat-mekanismin avulla. Jos klusterin solmussa menee pieleen, kyseiselle solmulle kirjoitetaan myrkkypilleri jaettuun tallennuslaitteeseen. Solmun täytyy syödä (hyväksyä) myrkkypilleri ja lopettaa itsensä. Tämän jälkeen tiedostojärjestelmäresurssi voidaan turvallisesti siirtää toiseen Linux-klusterin solmuun.

DELL-ympäristössä kaikki levyt ovat monipolkuisia. Tämä sisältää SBD STONITH -laitteen. Tämän vuoksi SBD STONITH -laitetta luotaessa SBD: n käyttämiä aikakatkaisuja on säädettävä, koska seuraavat voivat aiheuttaa viiveitä; Useiden polkujen I/O:iden (MPIO) polun alastunnistus, PowerPath-polun alastunnistuksen tai NMP-polun alastunnistuksen. Jos sinulla on useita laitteita, yhden laitteen tilapäiset aikakatkaisut eivät vaikuta negatiivisesti SBD: hen. Jos ne kaikki kuitenkin käyvät läpi samat FC-kytkimet, sinun on tehtävä tämä. Vahtikoiran aikakatkaisu on aika, joka tarvitaan polkuvirheen havaitsemiseen ja toiseen polkuun vaihtamiseen. Jälkeen msgwait aikakatkaisu, viesti oletetaan toimitetuksi solmuun. Monipolussa tämän pitäisi olla aika, joka tarvitaan monipolkuun polkuvirheen havaitsemiseksi ja seuraavaan polkuun siirtymiseksi, lisättynä kahden silmukan väliseen aikaan SBD-laitteen käyttämiseksi (oletusväli kahden silmukan välillä on 1 s).

Vahtikoiran aikakatkaisun on oltava lyhyempi kuin msgwait aikakatkaisu - puolet arvosta on hyvä arvo käytettäväksi.

Oletusarvo msgwait aikakatkaisu on 10 s. Jos msgwait Aikakatkaisua ei ole säädetty, se on liian lyhyt aika isännälle, jolla on ongelma polulla käytettäessä SBD-laitetta, jotta hän voi havaita, että polku on viallinen, ja siirtyä vikasietoon toiseen polkuun. Jos isäntä ei pysty päivittämään vahtikoiran ajastinta tarpeeksi nopeasti, isännälle kirjoitetaan myrkkypilleri. Tämä saa isännän tekemään itsemurhan, kun se voi käyttää SBD-laitetta uudelleen, mikä ei ole STONITH-mekanismin tarkoitus.

Voit määrittää nämä arvot lisäämällä -4 msgwait -1 watchdogtimeout luontikomentoon.
Tässä on esimerkki ESX-ympäristöstä, joka käyttää NMP:tä:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Tässä on esimerkki Linux-ympäristöstä, joka käyttää PowerPathia tai MPIO:ta (jossa devloss tmo asetettu arvoon 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Kaikki aikakatkaisut ovat sekunneissa.)

Additional Information

Tämän ongelman kaatuminen voi aiheuttaa merkittäviä viiveitä. Lisätietoja SBD STONITHISTA on kohdissa SUSE Storage Protection ja SBD (External Link)

Affected Products

PowerPath/VE for VMware

Products

PowerPath/VE for VMware
Article Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.