Isilon: Bir Isilon kümesinin veri kaybı için risk penceresinde olup olmadığını belirleme

Summary: Bir Isilon kümesinin veri kaybı riski penceresinde olup olmadığını belirleme.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Giriş

Bir kümede veya düğüm havuzunda veya disk havuzunda yeterli sayıda aygıt koruma düzeyine ulaşıldığında başarısız olduğunda Risk Penceresi (WOR) oluşur. Bu durum aynı zamanda "korumada" veya "aşırı koruma" olarak da bilinir. Bir küme veya havuz WOR içindeyse veri kaybı henüz oluşmaz. Ancak, başka aygıtlar arızalanırsa veri kaybı meydana gelebilir. Veri kaybının gerçekleşip gerçekleşmeyeceği farklı faktörlere bağlıdır. Bu faktörler arasında; FlexProtect tamamlanamadan veya arızalı aygıtlar söz konusu verinin tek kaynağıysa ek aygıtlar başarısız olur.

Bu makalede, kümede koruma düzeylerinin nasıl çalıştığı ve kümenizin veri kaybı için bir WOR'da olup olmadığını nasıl anlayabileceğiniz açıklanır.

NOT
WOR hesaplaması açısından "başarısız", "kapalı" veya "kullanım dışı" durumda olan cihazlar anlamına gelir. soft_failed" olan aygıtlar koruma düzeylerine dahil edilmez. Çalışmayan" veya "kullanım dışı" durumdaki aygıt sayısının nasıl belirleneceğini öğrenmek için aşağıdaki "Prosedür" bölümüne bakın.

NOT
Koruma seviyesi olarak belirtilen sayıdan daha fazla cihazın arızalanması durumuna "aşırı koruma" denir. Bu durumda, küme veya düğüm havuzu/disk havuzu burada depolanan tüm verileri artık başarıyla yeniden oluşturamaz.

 

Ayrıntılar

OneFS, N+M veri koruma modeli kullanır. N+M gösteriminde N, düğüm sayısını temsil eder. M, kümenin veri kaybetmeden işleyebileceği eşzamanlı düğüm, sürücü veya düğüm havuzu/disk havuzu sayısını temsil eder. Örneğin, N+2 korumasıyla küme veya havuz farklı düğümlerdeki iki sürücüyü veya iki düğümü tamamen kaybedebilir.

OneFS 6.5 ve sonraki sürümler N+M:B koruma modelini de destekler. N+M:B gösteriminde, N düğüm sayısını temsil eder. M, çalışmayan veya arızalı sürücü sayısını temsil eder. B, kümenin veya düğüm havuzunun/disk havuzunun veri kaybetmeden işleyebileceği kapalı veya arızalı düğüm sayısını temsil eder. Örneğin, N+3:1 korumasıyla küme veya havuz veri kaybetmeden üç sürücüyü ya da bir düğümü kaybedebilir.

WOR hesaplaması açısından, tek bir düğümdeki birden çok çalışmayan veya arızalı sürücü her zaman tek bir düğüm arızasını temsil eder (birden çok sürücü arızası yerine). Aşağıda, N+3:1 korumada 8 düğümlü küme kullanımına ilişkin bazı örnekler verilmiştir:

  • Örnek 1: Tek bir kümede, her biri farklı bir düğümde olmak üzere üç sürücü arızalanır. Bu, kümeyi bir VOR'a ("at protection") yerleştirir.
  • Örnek 2: Tek bir kümede, aynı düğümdeki iki sürücü arızalandı. Sürücüler aynı düğümde olduğundan, hatalar tek bir düğüm hatası olarak sayılır. Bu durum aynı zamanda kümeyi bir VOR'a ("at protection") sokar.

Veri koruma düzeyleri ve bunların nasıl hesaplandığı hakkında daha fazla bilgi için bkz. OneFS Yönetim Rehberi.

DİKKAT!
Kümenizin WOR durumunda olduğundan şüpheleniyor veya karar veriyorsanız harekete geçmeden önce yardım için Dell Teknik Destek ile iletişime geçin.

ÖNEMLİ!
Sürücüler veya düğümler arızalandığında bir WOR oluşabilir. Ancak Isilon Engineering, FlexProtect işlemi başarıyla tamamlanana kadar arızalı sürücüleri veya düğümleri kümede tutmanızı önerir. Bir aygıt arızalanmış olsa bile, veri bloklarının bazıları veya tümü okunabilir durumda olabilir. Sürücü veya düğümün kümeye katılması, arızalı aygıttan veri kurtarma girişimi gerekli hale gelirse esneklik sağlar.

 

Cause

Kümenin veya düğüm havuzunun/disk havuzunun şu anda bir WOR içinde olup olmadığını belirlemek için önce kümede veya havuzda yapılandırılan koruma düzeyini belirleyin. Ardından, kaç tane arızalı düğüm ve sürücü olduğunu belirleyin. WOR hesaplaması açısından "başarısız", "kapalı" veya "kullanım dışı" durumda olan cihazlar anlamına gelir. Aşağıdaki uygun bölümdeki talimatları izleyin.

Resolution

İşlemler

 

    OneFS 7.2, 8.0, 9.0 ve üzeri

    1. OneFS web yönetim arayüzünde File System > Storage Pools > SmartPools bölümüne gidin.
    2. Geçerli koruma düzeyini, Requested Protection sütunundaki Tiers & Node Pools tablosundan alın.
    3. Düğüme bir SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
    4. Aşağıdaki komutu çalıştırarak kaç aygıtın "çalışmıyor" veya "kullanım dışı" olduğunu belirleyin:



      isi_group_info Şöyle bir çıktı alırsınız. Kapalı veya ölü cihazlar varsa, bunlar çıkışta "kapalı" veya "ölü" olarak gösterilir.

      Kapalı düğüm örneği: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, aşağı: 6 }

      Aşağı sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, aşağı: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      Ölü sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, ölü: 2:10 }
    Çalışmayan veya kullanılmayan aygıtların sürücü mü yoksa düğüm mü olduğunun nasıl anlaşılacağı da dahil olmak üzere çıktıyı yorumlama hakkında bilgi için bkz.:  OneFS Grup Değişikliklerini Anlama veya Grup Değişikliklerini Yorumlama.

    OneFS 7.1

    1. OneFS web yönetim arayüzünde File System Management > Storage Pools > SmartPools bölümüne gidin.
    2. Geçerli koruma düzeyini, Requested Protection sütunundaki Node Pools tablosundan alın.
    3. Düğüme bir SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
    4. Aşağıdaki komutu çalıştırarak kaç aygıtın "çalışmıyor" veya "kullanım dışı" olduğunu belirleyin:



      isi_group_info Şöyle bir çıktı alırsınız. Kapalı veya ölü cihazlar varsa, bunlar çıkışta "kapalı" veya "ölü" olarak gösterilir.

      Kapalı düğüm örneği: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, aşağı: 6 }

      Aşağı sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, aşağı: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      Ölü sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, ölü: 2:10 }

      Çalışmayan veya kullanılmayan aygıtların sürücü mü yoksa düğüm mü olduğunu anlama da dahil olmak üzere çıktıyı yorumlama hakkında bilgi için bkz.: OneFS Grup Değişikliklerini Anlama veya Grup Değişikliklerini Yorumlama.

    OneFS 7.0

    1. OneFS web yönetim arayüzünde File System Management > SmartPools > Summary bölümüne gidin.
    2. Koruma sütunundaki Tiers & Node Pools tablosundan geçerli koruma düzeyini alın.
    3. Düğüme bir SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
    4. Aşağıdaki komutu çalıştırarak kaç aygıtın "çalışmıyor" veya "kullanım dışı" olduğunu belirleyin:



      isi_group_info Şöyle bir çıktı alırsınız. Kapalı veya ölü cihazlar varsa, bunlar çıkışta "kapalı" veya "ölü" olarak gösterilir.

      Kapalı düğüm örneği: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, aşağı: 6 }

      Aşağı sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, aşağı: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      Ölü sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, ölü: 2:10 }
    Çalışmayan veya kullanılmayan aygıtların sürücü mü yoksa düğüm mü olduğunun nasıl anlaşılacağı da dahil olmak üzere çıktıyı yorumlama hakkında bilgi için bkz.: OneFS Grup Değişikliklerini Anlama veya Grup Değişikliklerini Yorumlama.

    OneFS 6.5

    1. OneFS web yönetim arayüzünde File System > SmartPools > Disk Pools öğesine gidin.
    2. Geçerli koruma düzeyini Default Protection sütunundan alın.
    3. Düğüme bir SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
    4. Aşağıdaki komutu çalıştırarak kaç aygıtın "çalışmıyor" veya "kullanım dışı" olduğunu belirleyin:



      isi_group_info Şöyle bir çıktı alırsınız. Kapalı veya ölü cihazlar varsa, bunlar çıkışta "kapalı" veya "ölü" olarak gösterilir.

      Kapalı düğüm örneği: efs.gmp.group: { 3-4:0-8, 5:0-6,8, 9:1-2,4-6,8, 12:0-11, aşağı: 6 }

      Aşağı sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-10, 5:0-11, 6:0-11, aşağı: 2:10, 4:11, soft_failed: 2:10, 4:11 }

      Ölü sürücü örneği: efs.gmp.group: { 1:0-11, 2:0-9,11, 3:0-11, 4:0-11, 5:0-11, 6:0-11, ölü: 2:10 }
    Çalışmayan veya kullanılmayan aygıtların sürücü mü yoksa düğüm mü olduğunun nasıl anlaşılacağı da dahil olmak üzere çıktıyı yorumlama hakkında bilgi için bkz.: OneFS Grup Değişikliklerini Anlama veya Grup Değişikliklerini Yorumlama.

    Affected Products

    PowerScale OneFS

    Products

    Isilon
    Article Properties
    Article Number: 000018892
    Article Type: Solution
    Last Modified: 09 Jul 2025
    Version:  4
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.