Isilon: Sådan finder du ud af, om en Isilon-klynge befinder sig i et vindue med risiko for datatab

Summary: Sådan finder du ud af, om en Isilon-klynge befinder sig i et vindue med risiko for datatab.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Indledning

Et risikovindue (WOR) opstår, når tilstrækkeligt mange enheder i en klynge- eller nodepulje eller diskpulje ikke har kunnet nås, så beskyttelsesniveauet er nået. Denne tilstand er også kendt som "ved beskyttelse" eller "overbeskyttelse". Når en klynge eller pulje er i en WOR, er der endnu ikke sket datatab. Men hvis yderligere enheder fejler, kan der opstå datatab. Hvorvidt datatab opstår, afhænger af forskellige faktorer. Disse faktorer omfatter; yderligere enheder fejler, før FlexProtect kan fuldføres, eller hvis de defekte enheder var den eneste kilde til de pågældende data.

I denne artikel beskrives, hvordan beskyttelsesniveauerne fungerer på klyngen, og hvordan du kan se, om klyngen er i en WOR for datatab.

SEDDEL
I forbindelse med WOR-beregning betyder "fejlet" enheder, der er i en "nede" eller "død" tilstand. Enheder, der er "soft_failed", tælles ikke med i beskyttelsesniveauerne. Se afsnittet "Procedure" nedenfor for at finde ud af, hvordan du bestemmer antallet af "nede" eller "døde" enheder.

SEDDEL
Den tilstand, hvor flere enheder fejler end det tal, der er angivet som beskyttelsesniveau, kaldes "overbeskyttelse". I denne tilstand kan klynge- eller nodepuljen/diskpuljen ikke længere genoprette alle de data, der er gemt der.

 

Detaljer

OneFS bruger en N+M-databeskyttelsesmodel. I N+M-notationen repræsenterer N antallet af noder. M repræsenterer antallet af samtidige noder, drev eller nodepulje/diskpulje, som klyngen kan håndtere uden at miste data. Med N+2-beskyttelse kan klyngen eller gruppen f.eks. miste enten to drev på forskellige noder eller helt miste to noder.

OneFS 6.5 og nyere understøtter også en N+M:B-beskyttelsesmodel. I N+M:B-notationen repræsenterer N antallet af noder. M repræsenterer antallet af nede eller defekte drev. B repræsenterer antallet af nedbehæftede eller fejlbehæftede noder, som klynge- eller nodepuljen/diskpuljen kan håndtere uden at miste data. Med N+3:1-beskyttelse kan klyngen eller gruppen f.eks. miste tre drev eller én node uden at miste data.

Flere nede eller defekte drev i en enkelt node repræsenterer altid en enkelt nodefejl (snarere end flere drevfejl) med henblik på WOR-beregning. Her er nogle eksempler på brug af en 8-nodeklynge ved N+3:1-beskyttelse:

  • Eksempel 1: I en enkelt klynge svigter tre drev, hver i en anden node. Dette sætter klyngen i en WOR ("ved beskyttelse").
  • Eksempel 2: I en enkelt klynge er to drev inden for samme node mislykket. Da drevene er i samme node, tælles fejlene som en enkelt nodefejl. Denne situation sætter også klyngen i en WOR ("ved beskyttelse").

Du kan finde flere oplysninger om databeskyttelsesniveauer, og hvordan de beregnes, i OneFS-administrationsvejledningen.

FORSIGTIGHED!
Hvis du har mistanke om eller konstaterer, at din klynge er i en WOR-tilstand, skal du kontakte Dells tekniske support for at få hjælp, før du foretager dig yderligere.

VIGTIG!
En WOR kan opstå, når drev eller noder svigter. Isilon Engineering anbefaler dog, at du beholder defekte drev eller noder i klyngen, indtil FlexProtect-handlingen er fuldført. Selvom en enhed er defekt, kan nogle eller alle datablokke muligvis stadig læses. Det giver fleksibilitet at lade drevet eller noden være forbundet til klyngen, hvis det bliver nødvendigt at forsøge at gendanne data fra den defekte enhed.

 

Cause

Hvis du vil afgøre, om klynge- eller nodepuljen/diskpuljen i øjeblikket er i en WOR, skal du først bestemme det beskyttelsesniveau, der er konfigureret for klyngen eller puljen. Find derefter ud af, hvor mange defekte noder og drev, der findes. I forbindelse med WOR-beregning betyder "fejlet" enheder, der er i en "nede" eller "død" tilstand. Følg instruktionerne i det relevante afsnit, der følger.

Resolution

Procedure

 

    OneFS 7.2, 8.0, 9.0 og derover

    1. I OneFS-webadministrationsgrænsefladen skal du gå til File System > Storage Pools > SmartPools.
    2. Få det aktuelle beskyttelsesniveau fra tabellen Niveauer og nodepuljer i kolonnen Anmodet beskyttelse .
    3. Åbn en SSH-forbindelse til noden, og log ind ved hjælp af "root" -kontoen.
    4. Find ud af, hvor mange enheder der er "nede" eller "døde", ved at køre følgende kommando:



      isi_group_info Outputtet ligner følgende. Hvis der er nede eller døde enheder, er de angivet som "ned" eller "døde" i udgangen.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned:

      6
      } Eksempel på et down-drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 2:10, 4:11, soft_failed: 2:10, 4:11

      } Eksempel på et dødt drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 2:10 }
    Du kan få oplysninger om fortolkning af outputtet, herunder hvordan du forstår, om de døde enheder er drev eller noder, under:  Om OneFS-gruppeændringer eller fortolkning af gruppeændringer.

    OneFS 7.1

    1. I OneFS-webadministrationsgrænsefladen skal du gå til File System Management > Storage Pools > SmartPools.
    2. Få det aktuelle beskyttelsesniveau fra tabellen Nodepuljer i kolonnen Anmodet beskyttelse .
    3. Åbn en SSH-forbindelse til noden, og log ind ved hjælp af "root" -kontoen.
    4. Find ud af, hvor mange enheder der er "nede" eller "døde", ved at køre følgende kommando:



      isi_group_info Outputtet ligner følgende. Hvis der er nede eller døde enheder, er de angivet som "ned" eller "døde" i udgangen.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned:

      6
      } Eksempel på et down-drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 2:10, 4:11, soft_failed: 2:10, 4:11

      } Eksempel på et dødt drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 2:10 }

      Du kan få oplysninger om fortolkning af outputtet, herunder hvordan du forstår, om de døde enheder er drev eller noder, under: Om OneFS-gruppeændringer eller fortolkning af gruppeændringer.

    OneFS 7.0

    1. I OneFS-webadministrationsgrænsefladen skal du gå til Oversigt over File System Management > SmartPools>.
    2. Få det aktuelle beskyttelsesniveau fra tabellen Niveauer og nodepuljer i kolonnen Beskyttelse .
    3. Åbn en SSH-forbindelse til noden, og log ind ved hjælp af "root" -kontoen.
    4. Find ud af, hvor mange enheder der er "nede" eller "døde", ved at køre følgende kommando:



      isi_group_info Outputtet ligner følgende. Hvis der er nede eller døde enheder, er de angivet som "ned" eller "døde" i udgangen.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned:

      6
      } Eksempel på et down-drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 2:10, 4:11, soft_failed: 2:10, 4:11

      } Eksempel på et dødt drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 2:10 }
    Du kan få oplysninger om fortolkning af outputtet, herunder hvordan du forstår, om de døde enheder er drev eller noder, under: Om OneFS-gruppeændringer eller fortolkning af gruppeændringer.

    OneFS 6.5

    1. I OneFS-webadministrationsgrænsefladen skal du gå til File System > SmartPools > Disk Pools.
    2. Få det aktuelle beskyttelsesniveau fra kolonnen Standardbeskyttelse .
    3. Åbn en SSH-forbindelse til noden, og log ind ved hjælp af "root" -kontoen.
    4. Find ud af, hvor mange enheder der er "nede" eller "døde", ved at køre følgende kommando:



      isi_group_info Outputtet ligner følgende. Hvis der er nede eller døde enheder, er de angivet som "ned" eller "døde" i udgangen.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned:

      6
      } Eksempel på et down-drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 2:10, 4:11, soft_failed: 2:10, 4:11

      } Eksempel på et dødt drev: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 2:10 }
    Du kan få oplysninger om fortolkning af outputtet, herunder hvordan du forstår, om de døde enheder er drev eller noder, under: Om OneFS-gruppeændringer eller fortolkning af gruppeændringer.

    Affected Products

    PowerScale OneFS

    Products

    Isilon
    Article Properties
    Article Number: 000018892
    Article Type: Solution
    Last Modified: 09 Jul 2025
    Version:  4
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.