Linux 클러스터에서 SBD STONITH를 구현하는 방법

Summary: 이 문서의 목적은 SBD(Storage-Based Death) STONITH의 작동 방식과 다중 경로 환경에서 이를 구현하는 방법을 설명하는 것입니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

스토니스: "Shoot The Other Node In The Head" 또는 "Shoot The Offending Node In The Head"
또는
STONITH: "Shoot The Other Member or Machine In The Head"

STONITH는 컴퓨터 클러스터에서 펜싱을 하는 기술입니다. 펜싱은 컴퓨터 클러스터에 중단을 일으키지 않도록 장애가 발생한 노드를 격리하는 것입니다.

SBD STONITH에서 Linux 클러스터의 노드는 하트비트 메커니즘을 사용하여 서로를 업데이트된 상태로 유지합니다. 클러스터의 노드에 문제가 발생하면 해당 노드에 대한 포이즌 필이 공유 스토리지 디바이스에 기록됩니다. 노드는 포이즌 필을 먹고(받아들이고) 스스로 종료해야 합니다. 그런 다음 파일 시스템 리소스를 Linux 클러스터의 다른 노드로 안전하게 페일오버할 수 있습니다.

DELL 환경에서는 모든 디스크가 다중 경로입니다. 여기에는 SBD STONITH 디바이스가 포함됩니다. 따라서 SBD STONITH 디바이스를 만들 때 다음과 같은 경우 지연이 발생할 수 있으므로 SBD에서 사용하는 시간 제한을 조정해야 합니다. MPIO(Multiple Path I/O) 경로 다운 탐지, PowerPath 경로 다운 탐지 또는 NMP 경로 다운 탐지. 여러 디바이스가 있는 경우 단일 디바이스의 일시적인 시간 초과는 SBD에 부정적인 영향을 주지 않습니다. 그러나 모두 동일한 FC 스위치를 통과하는 경우 이 작업을 수행해야 합니다. Watchdog 시간 초과는 경로 장애를 탐지하고 다른 경로로 전환하는 데 필요한 시간입니다. 이후 msgwait timeout이면 메시지가 노드에 전달된 것으로 간주됩니다. 다중 경로의 경우 경로 다중화가 경로 장애를 감지하고 다음 경로로 전환하는 데 필요한 시간에 SBD 디바이스에 액세스하기 위해 두 루프 사이의 시간에 추가되어야 합니다(두 루프 사이의 기본 간격은 1초).

Watchdog 시간 초과는 msgwait timeout - 값의 절반은 사용하기에 좋은 값입니다.

기본값 msgwait 시간 초과는 10초입니다. 만약에 msgwait 시간 제한이 조정되지 않았습니다. SBD 디바이스에 액세스할 때 경로에 문제가 있는 호스트가 경로가 잘못되었음을 감지하고 다른 경로로 페일오버할 시간을 제공하기에는 시간 제한이 너무 짧습니다. 호스트가 Watchdog Timer를 충분히 빠르게 업데이트할 수 없는 경우 포이즌 필이 호스트에 기록됩니다. 이로 인해 호스트가 SBD 디바이스에 다시 액세스할 수 있을 때 자살하게 되며, 이는 STONITH 메커니즘의 목적이 아닙니다.

다음을 추가하여 이러한 값을 설정합니다. -4 msgwait -1 watchdogtimeout create 명령으로.
다음은 NMP를 사용하는 ESX 환경의 예입니다.
/usr/sbin/sbd -d /dev/sbd -4 40 -1 20 create
다음은 PowerPath 또는 MPIO( devloss tmo 30으로 설정):
/usr/sbin/sbd -d /dev/sbd -4 72 -1 36 create
(모든 시간 초과는 초 단위입니다.)

Additional Information

이 문제로 인해 페일오버하는 데 상당한 지연이 발생할 수 있습니다. SBD STONITH에 대한 자세한 내용은 SUSE Storage Protection 및 SBD(외부 링크)를 참조하십시오.

Affected Products

PowerPath/VE for VMware

Products

PowerPath/VE for VMware
Article Properties
Article Number: 000022740
Article Type: How To
Last Modified: 22 Aug 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.