Isilon: Isilon 클러스터가 데이터 손실 위험 기간에 있는지 확인하는 방법

Summary: Isilon 클러스터가 데이터 손실 위험 범위에 있는지 확인하는 방법

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

소개

WOR(Window Of Risk)은 클러스터, 노드 풀 또는 디스크 풀에서 보호 수준에 도달한 충분한 디바이스에 장애가 발생한 경우에 발생합니다. 이 상태를 "보호 중" 또는 "과잉 보호"라고도 합니다. 클러스터 또는 풀이 WOR에 있는 경우 데이터 손실이 아직 발생하지 않은 것입니다. 그러나 추가 디바이스에 장애가 발생하면 데이터 손실이 발생할 수 있습니다. 데이터 손실이 발생하는지 여부는 다양한 요인에 따라 달라집니다. 이러한 요인은 다음과 같습니다. FlexProtect가 완료되기 전에 장애가 발생하거나 장애가 발생한 디바이스가 해당 데이터의 유일한 소스인 경우 추가 디바이스가 실패합니다.

이 문서에서는 클러스터에서 보호 수준이 작동하는 방식과 클러스터가 데이터 손실에 대한 WOR에 있는지 확인하는 방법에 대해 설명합니다.

메모
WOR 계산을 위해 "실패"는 "다운" 또는 "죽은" 상태에 있는 장치를 의미합니다. "soft_failed"인 디바이스는 보호 수준에 포함되지 않습니다. "다운" 또는 "비활성" 디바이스의 수를 확인하는 방법은 아래의 "절차" 섹션을 참조하십시오.

메모
보호 수준으로 지정된 수보다 더 많은 디바이스가 실패하는 상태를 "과잉 보호"라고 합니다. 이 상태에서는 클러스터 또는 노드 풀/디스크 풀이 더 이상 저장된 모든 데이터를 성공적으로 다시 만들 수 없습니다.

 

세부 정보

OneFS는 N+M 데이터 보호 모델을 사용합니다. N+M 표기법에서 N은 노드 수를 나타냅니다. M은 클러스터가 데이터 손실 없이 처리할 수 있는 동시 노드, 드라이브 또는 노드 풀/디스크 풀의 수를 나타냅니다. 예를 들어 N+2 보호를 사용하면 클러스터 또는 풀에서 서로 다른 노드에 있는 두 개의 드라이브가 손실되거나 두 개의 노드가 모두 손실될 수 있습니다.

OneFS 6.5 이상에서는 N+M:B 보호 모델도 지원합니다. N+M:B 표기법에서 N은 노드 수를 나타냅니다. M은 작동이 중단되거나 장애가 발생한 드라이브의 수를 나타냅니다. B는 클러스터 또는 노드 풀/디스크 풀이 데이터 손실 없이 처리할 수 있는 다운되거나 실패한 노드의 수를 나타냅니다. 예를 들어 N+3:1 보호를 사용하면 클러스터 또는 풀에서 데이터 손실 없이 드라이브 3개 또는 노드 1개를 잃을 수 있습니다.

단일 노드 내에서 작동이 중지되거나 장애가 발생한 여러 드라이브는 WOR 계산을 위해 항상 (여러 드라이브 장애가 아닌) 단일 노드 장애를 나타냅니다. 다음은 N+3:1 보호로 8노드 클러스터를 사용하는 몇 가지 예입니다.

  • 예 1: 단일 클러스터에서 각각 다른 노드에서 3개의 드라이브에서 장애가 발생합니다. 이렇게 하면 클러스터가 WOR("보호 상태")이 됩니다.
  • 예 2: 단일 클러스터에서 동일한 노드 내의 드라이브 2개에 장애가 발생했습니다. 드라이브가 동일한 노드에 있으므로 장애가 단일 노드 장애로 계산됩니다. 이 경우 클러스터도 WOR("보호 상태")에 놓이게 됩니다.

데이터 보호 수준 및 데이터 보호 수준 계산 방법에 대한 자세한 내용은 OneFS 관리 가이드를 참조하십시오.

주의!
클러스터가 WOR 상태인 것으로 의심되거나 판단되는 경우 추가 조치를 취하기 전에 Dell 기술 지원 부서에 문의하여 지원을 받으십시오.

중요하다!
드라이브 또는 노드에 장애가 발생하면 WOR이 발생할 수 있습니다. 하지만 Isilon 엔지니어링 팀에서는 FlexProtect 작업이 성공적으로 완료될 때까지 장애가 발생한 드라이브나 노드를 클러스터에 유지하는 것이 좋습니다. 디바이스에 장애가 발생했지만 여전히 데이터 블록의 일부 또는 전부를 읽을 수 있습니다. 장애가 발생한 디바이스에서 데이터를 복구해야 할 경우 드라이브 또는 노드를 클러스터에 연결된 상태로 두면 유연성이 제공됩니다.

 

Cause

클러스터 또는 노드 풀/디스크 풀이 현재 WOR에 있는지 확인하려면 먼저 클러스터 또는 풀에 구성된 보호 수준을 확인합니다. 그런 다음 장애가 발생한 노드 및 드라이브의 수를 확인합니다. WOR 계산을 위해 "실패"는 "다운" 또는 "죽은" 상태에 있는 장치를 의미합니다. 다음 섹션의 지침을 따릅니다.

Resolution

절차

 

    OneFS 7.2, 8.0, 9.0 이상

    1. OneFS 웹 관리 인터페이스에서 File System > Storage PoolsSmartPools>로 이동합니다.
    2. Requested Protection 열의 Tiers & Node Pools 표에서 현재 보호 수준을 가져옵니다.
    3. 노드에 대한 SSH 연결을 열고 "root" 계정을 사용하여 로그인합니다.
    4. 다음 명령을 실행하여 "다운" 또는 "비활성" 상태인 디바이스 수를 확인합니다.



      isi_group_info 출력은 다음과 유사합니다. 작동이 중단되거나 작동하지 않는 디바이스가 있는 경우 출력에 "작동이 중단" 또는 "중단"으로 표시됩니다.

      다운 노드의 예: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, 아래로:

      6
      } 다운 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, 아래로: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      작동하지 않는 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, 사망: 2:10 }
    작동이 중지되거나 작동하지 않는 디바이스가 드라이브인지 노드인지 파악하는 방법을 비롯하여 출력 해석에 대한 자세한 내용은 다음을 참조하십시오.  OneFS 그룹 변경 사항 이해 또는 그룹 변경 해석

    OneFS 7.1

    1. OneFS 웹 관리 인터페이스에서 File System ManagementStorage > PoolsSmartPools > 로 이동합니다.
    2. Requested Protection 열의 Node Pools 표에서 현재 보호 수준을 가져옵니다.
    3. 노드에 대한 SSH 연결을 열고 "root" 계정을 사용하여 로그인합니다.
    4. 다음 명령을 실행하여 "다운" 또는 "비활성" 상태인 디바이스 수를 확인합니다.



      isi_group_info 출력은 다음과 유사합니다. 작동이 중단되거나 작동하지 않는 디바이스가 있는 경우 출력에 "작동이 중단" 또는 "중단"으로 표시됩니다.

      다운 노드의 예: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, 아래로:

      6
      } 다운 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, 아래로: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      작동하지 않는 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, 사망: 2:10 }

      작동 중지되거나 작동하지 않는 디바이스가 드라이브인지 노드인지 파악하는 방법을 포함하여 출력 해석에 대한 자세한 내용은 다음을 참조하십시오. OneFS 그룹 변경 사항 이해 또는 그룹 변경 해석

    OneFS 7.0

    1. OneFS 웹 관리 인터페이스에서 File System ManagementSmartPoolsSummary >>로 이동합니다.
    2. Protection 열의 Tiers & Node Pools 표에서 현재 보호 수준을 확인합니다.
    3. 노드에 대한 SSH 연결을 열고 "root" 계정을 사용하여 로그인합니다.
    4. 다음 명령을 실행하여 "다운" 또는 "비활성" 상태인 디바이스 수를 확인합니다.



      isi_group_info 출력은 다음과 유사합니다. 작동이 중단되거나 작동하지 않는 디바이스가 있는 경우 출력에 "작동이 중단" 또는 "중단"으로 표시됩니다.

      다운 노드의 예: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, 아래로:

      6
      } 다운 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, 아래로: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      작동하지 않는 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, 사망: 2:10 }
    작동이 중지되거나 작동하지 않는 디바이스가 드라이브인지 노드인지 파악하는 방법을 비롯하여 출력 해석에 대한 자세한 내용은 다음을 참조하십시오. OneFS 그룹 변경 사항 이해 또는 그룹 변경 해석

    OneFS 6.5

    1. OneFS 웹 관리 인터페이스에서 File SystemSmartPoolsDisk >> Pools로 이동합니다.
    2. Default Protection 열에서 현재 보호 수준을 확인합니다.
    3. 노드에 대한 SSH 연결을 열고 "root" 계정을 사용하여 로그인합니다.
    4. 다음 명령을 실행하여 "다운" 또는 "비활성" 상태인 디바이스 수를 확인합니다.



      isi_group_info 출력은 다음과 유사합니다. 작동이 중단되거나 작동하지 않는 디바이스가 있는 경우 출력에 "작동이 중단" 또는 "중단"으로 표시됩니다.

      다운 노드의 예: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, 아래로:

      6
      } 다운 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, 아래로: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      작동하지 않는 드라이브의 예: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, 사망: 2:10 }
    작동이 중지되거나 작동하지 않는 디바이스가 드라이브인지 노드인지 파악하는 방법을 비롯하여 출력 해석에 대한 자세한 내용은 다음을 참조하십시오. OneFS 그룹 변경 사항 이해 또는 그룹 변경 해석

    Affected Products

    PowerScale OneFS

    Products

    Isilon
    Article Properties
    Article Number: 000018892
    Article Type: Solution
    Last Modified: 09 Jul 2025
    Version:  4
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.