Як впровадити SBD STONITH у кластери Linux

Samenvatting: Метою цієї статті є пояснення того, як працює Storage-Based Death (SBD) STONITH і як його реалізувати в багатошляховому середовищі.

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Instructies

СТОНІТ: «Вистрілити іншому вузлу в голову» або «Вистрілити вузлу-порушнику в голову»
Або
СТОНІТ: «Вистріли іншому учаснику або машині в голову»STONITH

- це техніка фехтування в комп'ютерних кластерах. Фехтування - це ізоляція вузла, що вийшов з ладу, щоб він не викликав збоїв в роботі комп'ютерного кластера.

У SBD Stonith вузли в кластері Linux постійно оновлюють один одного за допомогою механізму Heartbeat. Якщо щось піде не так з вузлом у кластері, для цього вузла буде записано пігулку з отрутою на спільний пристрій зберігання даних. Вузол повинен з'їсти (прийняти) таблетку з отрутою і припинити свою діяльність. Після чого ресурс файлової системи може бути безпечно переданий іншому вузлу в кластері Linux.

У середовищі DELL всі диски є багатопроменевими. До них відноситься і пристрій SBD STONITH. Отже, під час створення пристрою SBD STONITH час очікування, який використовує SBD, має бути скоригований, оскільки наступне може спричинити затримки; Виявлення шляху вниз за допомогою кількох шляхів вводу/виводу (MPIO), виявлення шляху вниз за допомогою PowerPath або виявлення шляху вниз за допомогою NMP. Якщо у вас кілька пристроїв, тимчасові тайм-аути одного пристрою не впливають негативно на SBD. Однак, якщо всі вони проходять через одні й ті ж перемикачі FC, ви повинні це зробити. Тайм-аут сторожового таймера — це час, необхідний для виявлення помилки шляху та перемикання на інший шлях. Після msgwait timeout, передбачається, що повідомлення було доставлено вузлу. Для multipathing це має бути час, необхідний для виявлення помилки шляху та перемикання на наступний шлях, доданий до часу між двома петлями для доступу до пристрою SBD (інтервал між двома циклами за замовчуванням становить 1 с).

Тайм-аут сторожового таймера має бути коротшим, ніж час очікування msgwait Тайм-аут - половина значення є хорошим значенням для використання.

Значення за замовчуванням msgwait Тайм-аут становить 10 с. Якщо msgwait Час очікування не налаштовано, це занадто коротко, щоб дати час хосту, який має проблему на шляху під час доступу до пристрою SBD, щоб виявити, що шлях поганий, і переключитися на інший шлях. Якщо господар не може оновити таймер сторожового пса досить швидко, господареві виписується пігулка з отрутою. Це змушує господаря покінчити життя самогубством, коли він знову може отримати доступ до пристрою SBD, що не є метою механізму STONITH.

Ви б встановили ці значення, додавши -4 msgwait -1 watchdogtimeout до команди create.
Ось приклад для середовища ESX, яке використовує NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Ось приклад для середовища Linux, що використовує PowerPath або MPIO (з devloss tmo встановлено на 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Усі тайм-аути обчислюються секундами.)

Extra informatie

Ця проблема може спричинити значні затримки, щоб вийти з ладу. Для отримання додаткової інформації про SBD STONITH перегляньте розділи SUSE Storage Protection та SBD (external Link)

Getroffen producten

PowerPath/VE for VMware

Producten

PowerPath/VE for VMware
Artikeleigenschappen
Artikelnummer: 000022740
Artikeltype: How To
Laatst aangepast: 22 aug. 2024
Versie:  6
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.