Isilon: Slik fastslår du om en Isilon-klynge er i et risikovindu for tap av data

Summary: Slik finner du ut om en Isilon-klynge er i et vindu med risiko for tap av data.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Innledning

Et risikovindu (WOR) oppstår når nok enheter i en klynge eller nodepool eller diskutvalg ikke har klart at beskyttelsesnivået er nådd. Denne tilstanden er også kjent som "ved beskyttelse" eller "over beskyttelse." Når en klynge eller et utvalg er i et WOR, har det ennå ikke oppstått tap av data. Hvis flere enheter ikke fungerer, kan det imidlertid oppstå tap av data. Hvorvidt datatap oppstår, avhenger av ulike faktorer. Disse faktorene inkluderer; tilleggsenheter som svikter før FlexProtect kan fullføres, eller hvis enhetene som har sviktet, er den eneste kilden til de aktuelle dataene.

Denne artikkelen beskriver hvordan beskyttelsesnivåer fungerer på klyngen, og hvordan du kan finne ut om klyngen er i et WOR for tap av data.

NOTAT
I WOR-beregningen betyr "mislyktes" enheter som er i tilstanden "ned" eller "død". Enheter som er "soft_failed", telles ikke mot beskyttelsesnivåer. Se "Prosedyre"-delen nedenfor for informasjon om hvordan du fastslår antall enheter som er "nede" eller "døde".

NOTAT
Tilstanden der flere enheter svikter enn antallet som er angitt som beskyttelsesnivå, kalles "overbeskyttelse". I denne tilstanden kan ikke klyngen eller nodeutvalget/diskutvalget lenger gjenopprette alle dataene som er lagret der.

 

Detaljer

OneFS bruker en N+M-databeskyttelsesmodell. I N+M-notasjonen representerer N antall noder. M-en representerer antall samtidige noder, stasjoner eller nodeutvalg/diskutvalg som klyngen kan håndtere uten å miste data. Med beskyttelse mot N + 2 kan for eksempel klyngen eller utvalget miste enten to stasjoner på forskjellige noder, eller miste to noder helt.

OneFS 6.5 og nyere støtter også en beskyttelsesmodell N+M:B. I N+M:B-notasjon representerer N antall noder. M representerer antall nedadgående eller mislykkede disker. B representerer antall nedadgående eller mislykkede noder som klyngen eller nodeutvalget/diskutvalget kan håndtere uten å miste data. Med beskyttelse ikke + 3:1 kan for eksempel klyngen eller utvalget miste tre stasjoner eller én node uten å miste data.

Flere nedkjøringer eller feilslåtte disker i én enkelt node representerer alltid én enkelt nodefeil (i stedet for flere diskfeil) ved WOR-beregningen. Her er noen eksempler som bruker en 8-noders klynge med N + 3: 1-beskyttelse:

  • Eksempel 1: I en enkelt klynge svikter tre stasjoner, hver i en annen node. Dette setter klyngen i et WOR ("ved beskyttelse").
  • Eksempel 2: I én enkelt klynge har to drivere innenfor samme node mislyktes. Siden driverne er i samme node, telles feilene som en enkelt nodefeil. Denne situasjonen plasserer også klyngen i et WOR ("at protection").

Hvis du vil ha mer informasjon om databeskyttelsesnivåer og hvordan de beregnes, kan du se administrasjonsveiledningen for OneFS.

FORSIKTIGHET!
Hvis du mistenker eller fastslår at klyngen er i WAR-tilstand, bør du kontakte Dells tekniske kundestøtte for å få hjelp før du iverksetter ytterligere tiltak.

VIKTIG!
Et WOR kan oppstå når stasjoner eller noder svikter. Isilons tekniske avdeling anbefaler imidlertid at du beholder defekte stasjoner eller noder i klyngen til FlexProtect-operasjonen er fullført. Selv om en enhet har sviktet, kan noen eller alle blokker med data fortsatt være lesbare. Hvis det blir nødvendig å la disken eller noden være med i klyngen, får du fleksibilitet hvis det blir nødvendig å forsøke å gjenopprette data fra den defekte enheten.

 

Cause

Hvis du vil finne ut om klyngen eller nodeutvalget/diskutvalget for øyeblikket befinner seg i en WOR, må du først bestemme beskyttelsesnivået som er konfigurert for klyngen eller utvalget. Deretter bestemmer du hvor mange mislykkede noder og stasjoner som finnes. I WOR-beregningen betyr "mislyktes" enheter som er i tilstanden "ned" eller "død". Følg instruksjonene i den aktuelle delen som følger.

Resolution

Fremgangsmåte

 

    OneFS 7.2, 8.0, 9.0 og nyere

    1. I OneFS-grensesnittet for webadministrasjon går du til SmartPools > for filsystemlagringsgrupper>.
    2. Hent gjeldende beskyttelsesnivå fra tabellen Nivå og nodeutvalg i kolonnen Forespurt beskyttelse .
    3. Åpne en SSH-tilkobling til noden og logg på med "root" -kontoen.
    4. Finn ut hvor mange enheter som er "nede" eller "døde" ved å kjøre følgende kommando:



      isi_group_info Utdataene ser omtrent slik ut. Hvis det er nede eller døde enheter, er de angitt som "ned" eller "død" i utdataene.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned: 6 }

      Eksempel på en nedstasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 02:10, 04:11, soft_failed: 02:10, 04:11 }

      Eksempel på en død stasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 02:10}
    Hvis du vil ha informasjon om hvordan du tolker utdataene, inkludert hvordan du forstår om dunenheter eller døde enheter er stasjoner eller noder, kan du se:  Forstå OneFS-gruppeendringer eller tolke gruppeendringer.

    OneFS 7.1

    1. I OneFS-webadministrasjonsgrensesnittet går du til SmartPools > for lagringsutvalg for filsystemadministrasjon>.
    2. Hent gjeldende beskyttelsesnivå fra Nodeutvalg-tabellen i kolonnen Forespurt beskyttelse .
    3. Åpne en SSH-tilkobling til noden og logg på med "root" -kontoen.
    4. Finn ut hvor mange enheter som er "nede" eller "døde" ved å kjøre følgende kommando:



      isi_group_info Utdataene ser omtrent slik ut. Hvis det er nede eller døde enheter, er de angitt som "ned" eller "død" i utdataene.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned: 6 }

      Eksempel på en nedstasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 02:10, 04:11, soft_failed: 02:10, 04:11 }

      Eksempel på en død stasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 02:10 }

      Hvis du vil ha informasjon om hvordan du tolker utdataene, inkludert hvordan du forstår om dunenheter eller døde enheter er stasjoner eller noder, kan du se: Forstå OneFS-gruppeendringer eller tolke gruppeendringer.

    OneFS 7.0

    1. I OneFS-webadministrasjonsgrensesnittet går du til Sammendrag av smartpooler > for filsystemadministrasjon>.
    2. Hent gjeldende beskyttelsesnivå fra tabellen Lag og nodeutvalg i kolonnen Beskyttelse .
    3. Åpne en SSH-tilkobling til noden og logg på med "root" -kontoen.
    4. Finn ut hvor mange enheter som er "nede" eller "døde" ved å kjøre følgende kommando:



      isi_group_info Utdataene ser omtrent slik ut. Hvis det er nede eller døde enheter, er de angitt som "ned" eller "død" i utdataene.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned: 6 }

      Eksempel på en nedstasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 02:10, 04:11, soft_failed: 02:10, 04:11 }

      Eksempel på en død stasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 02:10}
    Hvis du vil ha informasjon om hvordan du tolker utdataene, inkludert hvordan du forstår om dunenheter eller døde enheter er stasjoner eller noder, kan du se: Forstå OneFS-gruppeendringer eller tolke gruppeendringer.

    OneFS 6.5

    1. I OneFS-grensesnittet for webadministrasjon går du til Diskutvalg for filsystemsmartpooler >>.
    2. Hent gjeldende beskyttelsesnivå fra kolonnen Standard beskyttelse .
    3. Åpne en SSH-tilkobling til noden og logg på med "root" -kontoen.
    4. Finn ut hvor mange enheter som er "nede" eller "døde" ved å kjøre følgende kommando:



      isi_group_info Utdataene ser omtrent slik ut. Hvis det er nede eller døde enheter, er de angitt som "ned" eller "død" i utdataene.

      Eksempel på en nednode: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, ned: 6 }

      Eksempel på en nedstasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, ned: 02:10, 04:11, soft_failed: 02:10, 04:11 }

      Eksempel på en død stasjon: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, død: 02:10}
    Hvis du vil ha informasjon om hvordan du tolker utdataene, inkludert hvordan du forstår om dunenheter eller døde enheter er stasjoner eller noder, kan du se: Forstå OneFS-gruppeendringer eller tolke gruppeendringer.

    Affected Products

    PowerScale OneFS

    Products

    Isilon
    Article Properties
    Article Number: 000018892
    Article Type: Solution
    Last Modified: 09 Jul 2025
    Version:  4
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.