Як впровадити SBD STONITH у кластери Linux
Summary: Метою цієї статті є пояснення того, як працює Storage-Based Death (SBD) STONITH і як його реалізувати в багатошляховому середовищі.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
СТОНІТ: «Вистрілити іншому вузлу в голову» або «Вистрілити вузлу-порушнику в голову»
Або
СТОНІТ: «Вистріли іншому учаснику або машині в голову»STONITH
- це техніка фехтування в комп'ютерних кластерах. Фехтування - це ізоляція вузла, що вийшов з ладу, щоб він не викликав збоїв в роботі комп'ютерного кластера.
У SBD Stonith вузли в кластері Linux постійно оновлюють один одного за допомогою механізму Heartbeat. Якщо щось піде не так з вузлом у кластері, для цього вузла буде записано пігулку з отрутою на спільний пристрій зберігання даних. Вузол повинен з'їсти (прийняти) таблетку з отрутою і припинити свою діяльність. Після чого ресурс файлової системи може бути безпечно переданий іншому вузлу в кластері Linux.
У середовищі DELL всі диски є багатопроменевими. До них відноситься і пристрій SBD STONITH. Отже, під час створення пристрою SBD STONITH час очікування, який використовує SBD, має бути скоригований, оскільки наступне може спричинити затримки; Виявлення шляху вниз за допомогою кількох шляхів вводу/виводу (MPIO), виявлення шляху вниз за допомогою PowerPath або виявлення шляху вниз за допомогою NMP. Якщо у вас кілька пристроїв, тимчасові тайм-аути одного пристрою не впливають негативно на SBD. Однак, якщо всі вони проходять через одні й ті ж перемикачі FC, ви повинні це зробити. Тайм-аут сторожового таймера — це час, необхідний для виявлення помилки шляху та перемикання на інший шлях. Після
Тайм-аут сторожового таймера має бути коротшим, ніж час очікування
Значення за замовчуванням
Ви б встановили ці значення, додавши
Ось приклад для середовища ESX, яке використовує NMP:
Ось приклад для середовища Linux, що використовує PowerPath або MPIO (з
(Усі тайм-аути обчислюються секундами.)
Або
СТОНІТ: «Вистріли іншому учаснику або машині в голову»STONITH
- це техніка фехтування в комп'ютерних кластерах. Фехтування - це ізоляція вузла, що вийшов з ладу, щоб він не викликав збоїв в роботі комп'ютерного кластера.
У SBD Stonith вузли в кластері Linux постійно оновлюють один одного за допомогою механізму Heartbeat. Якщо щось піде не так з вузлом у кластері, для цього вузла буде записано пігулку з отрутою на спільний пристрій зберігання даних. Вузол повинен з'їсти (прийняти) таблетку з отрутою і припинити свою діяльність. Після чого ресурс файлової системи може бути безпечно переданий іншому вузлу в кластері Linux.
У середовищі DELL всі диски є багатопроменевими. До них відноситься і пристрій SBD STONITH. Отже, під час створення пристрою SBD STONITH час очікування, який використовує SBD, має бути скоригований, оскільки наступне може спричинити затримки; Виявлення шляху вниз за допомогою кількох шляхів вводу/виводу (MPIO), виявлення шляху вниз за допомогою PowerPath або виявлення шляху вниз за допомогою NMP. Якщо у вас кілька пристроїв, тимчасові тайм-аути одного пристрою не впливають негативно на SBD. Однак, якщо всі вони проходять через одні й ті ж перемикачі FC, ви повинні це зробити. Тайм-аут сторожового таймера — це час, необхідний для виявлення помилки шляху та перемикання на інший шлях. Після
msgwait timeout, передбачається, що повідомлення було доставлено вузлу. Для multipathing це має бути час, необхідний для виявлення помилки шляху та перемикання на наступний шлях, доданий до часу між двома петлями для доступу до пристрою SBD (інтервал між двома циклами за замовчуванням становить 1 с).
Тайм-аут сторожового таймера має бути коротшим, ніж час очікування
msgwait Тайм-аут - половина значення є хорошим значенням для використання.
Значення за замовчуванням
msgwait Тайм-аут становить 10 с. Якщо msgwait Час очікування не налаштовано, це занадто коротко, щоб дати час хосту, який має проблему на шляху під час доступу до пристрою SBD, щоб виявити, що шлях поганий, і переключитися на інший шлях. Якщо господар не може оновити таймер сторожового пса досить швидко, господареві виписується пігулка з отрутою. Це змушує господаря покінчити життя самогубством, коли він знову може отримати доступ до пристрою SBD, що не є метою механізму STONITH.
Ви б встановили ці значення, додавши
-4 msgwait -1 watchdogtimeout до команди create.
Ось приклад для середовища ESX, яке використовує NMP:
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
Ось приклад для середовища Linux, що використовує PowerPath або MPIO (з
devloss tmo встановлено на 30):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(Усі тайм-аути обчислюються секундами.)
Additional Information
Ця проблема може спричинити значні затримки, щоб вийти з ладу. Для отримання додаткової інформації про SBD STONITH перегляньте розділи SUSE Storage Protection та SBD (external Link)
Affected Products
PowerPath/VE for VMwareProducts
PowerPath/VE for VMwareArticle Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.