Data Domain: Data Domain Sıkıştırma İşlemini Anlama

Résumé: Kullanılan sıkıştırma türlerini, terminolojiyi ve Data Domain'de sıkıştırmanın diğer yönlerini açıklamak için terminolojiler, ödünleşimler ve ölçüler burada açıklanmıştır.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Instructions

Bir Data Domain'de kullanılan sıkıştırma teknikleri, yedekleme verilerinin gerektirdiği fiziksel alanı azaltmak için en gelişmiş teknikleri kullanır. Ayrıca, sıkıştırma düzeylerine ilişkin teknolojiler ve ölçümler son derece karmaşık konulardır.

Bu makalede, kullanılan sıkıştırma türünü ve bir Data Domain ortamındaki sıkıştırmanın diğer yönlerini daha iyi açıklamaya yönelik bazı terminolojiler, ödünleşimler ve önlemler ele alınmaktadır.

AŞAĞIDAKİLER İÇİN GEÇERLİDİR: Tüm Data Domain Modelleri

Giriş:

Son güncelleme tarihi: Ocak 2024

  • Sıkıştırma, bir veri kümesini daha az fiziksel alan kullanarak depolamayı amaçlayan bir veri azaltma teknolojisidir.
  • Data Domain sistemlerinde (DDOS), kullanıcı verilerini sıkıştırmak için tekilleştirme ve yerel sıkıştırma yapılır. Tekilleştirme veya "tekilleştirme", gereksiz veri segmentlerini tanımlamak ve yalnızca benzersiz veri segmentlerini saklamak için kullanılır.
  • Yerel sıkıştırma, benzersiz veri segmentlerini aşağıdakiler gibi belirli sıkıştırma algoritmalarıyla daha da sıkıştırır: lz, gzfast, gz, benzeri.
  • DDOS'ta genel kullanıcı veri sıkıştırması, tekilleştirme ve yerel sıkıştırmanın ortak çabasıdır. DDOS, veri sıkıştırma işleminin etkililiğini ölçmek için "compression ratio" (sıkıştırma oranı) değerini kullanır.
  • Genel olarak, toplam kullanıcı veri boyutunun, sıkıştırılmış verilerin toplam boyutuna veya kullanılan fiziksel alan boyutuna oranıdır.
  • Data Domain dosya sistemi, "günlük yapılı" bir tekilleştirme dosya sistemidir.
  • Günlük yapılandırmalı dosya sistemleri yalnızca sisteme veri ekleyebilir; silme işlemi tek başına fiziksel alan açamaz.
  • Bu tür dosya sistemleri, artık gerekli olmayan alanı geri kazanmak için çöp toplama işlemini kullanır.
  • Günlük yapılı dosya sisteminin özellikleri ve tekilleştirilmiş teknoloji bir araya geldiğinde, DDOS'ta sıkıştırmanın tüm yönlerini net bir şekilde anlamayı zorlaştırır.

Sıkıştırma için ölçülebilecek birçok yön vardır.

Bu makalede, DDOS sıkıştırmasının anlaşılmasına yardımcı olacak adım adım ayrıntılar ele alınmaktadır.

  • İlk olarak, bize bir Data Domain sisteminde elde edilen gerçekçi sıkıştırmayı, kullanıcı verisi miktarını, tüketilen fiziksel alan miktarını ve bunların oranını söyleyen genel sistem sıkıştırma etkisi açıklanır.
  • Bu oran, bu makalede "sistem etkin sıkıştırma oranı" olarak adlandırılmaktadır.
  • DDOS, tekilleştirmeyi satır içi olarak gerçekleştirir ve orijinal kullanıcı veri segmentlerinin, tekilleştirme sonrası benzersiz veri segmentlerinin ve benzersiz veri segmentleri üzerindeki yerel sıkıştırma etkisinin istatistiklerini izler.
  • Bu satır içi sıkıştırma istatistikleri, satır içi sıkıştırma etkisini ölçmek için kullanılır. Satır içi sıkıştırma istatistikleri her yazma için ölçülebilir. Ayrıca DDOS, istatistikleri farklı düzeylerde izler: Dosyaları MTreesve tüm sistem.
Bu makalenin içeriği, bu makalenin yayınlanmasına kadar DDOS 7.13 e kadar tüm DDOS sürümlerine uygulanabilir.

İçeriğinin tamamının gelecek sürümler için geçerli olacağına dair bir garanti yoktur.

5.0'dan önceki sürümlerde tüm sistemde yalnızca bir tane bulunur mtree ve terim mtree açıkça belirtilmemiştir.

Sıkıştırma: Sistem Genel Etkisi:

Sistem genelinde genel sıkıştırma etkisi, kullanıcı veri boyutunun kullanılan fiziksel alan boyutuna oranı olan etkin sıkıştırma oranıyla ölçülür. Tarafından bildirildi "filesys show compression" (FSC) CLI komutunu çalıştırın (ilgili bilgiler kullanıcı arayüzünde de mevcuttur). Örnek bir çıktı FSC aşağıda gösterilmiştir:

# filesys show compression
From: 2023-12-31 03:00 To: 2024-01-07 03:00

Active Tier:
                   Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                      (GiB)       (GiB)        Factor       Factor          Factor
                                                                     (Reduction %)
----------------   --------   ---------   -----------   ----------   -------------
Currently Used:*     6439.6       113.4             -            -    56.8x (98.2)
Written:
  Last 7 days      135421.3      1782.0         35.1x         2.2x    76.0x (98.7)
  Last 24 hrs         532.5         1.5        334.3x         1.1x   356.5x (99.7)
----------------   --------   ---------   -----------   ----------   -------------
 * Does not include the effects of pre-comp file deletes/truncates
   since the last cleaning on 2024/01/05 11:34:13.
    •  
    • Sistem etkin sıkıştırma oranı, CLI çıktısında sonuç bölümünün 1. satırında bildirilir. Satır yukarıda vurgulanmıştır.
    • Toplam kullanıcı verisi boyutu "Ön Sıkıştırma" olarak etiketlenir.
    • Tüketilen toplam fiziksel alan (hem verilere hem de meta verilere göre) "Post-Comp" olarak etiketlenir.
    • "Pre-Comp" numarası ve "Post-Comp" numarasının her ikisi de çalışma zamanında okunur. FSC Tüm sistemi örtük olarak senkronize eder, ardından iki sayıyı sorgular.
      • Bu iki sayı, " ile aynı şekilde ölçülür.filesys show space" komutunu kullanın.
      • Sistem etkin sıkıştırma oranı = Sıkıştırma Öncesi/Sıkıştırma Sonrası
Çıktının geri kalanında satır içi sıkıştırma istatistikleri açıklanmaktadır (daha sonra ele alınacaktır).

Sistemin etkin sıkıştırma oranını etkileyebilecek bazı işlemler vardır:

  • Hızlı kopyalama
    • Ne zaman bir fastcopy etkin ad alanındaki bir dosyadan (anlık görüntü değil) yapılırsa, hedef dosya için fazladan fiziksel alan gerekmediğinden mükemmel bir tekilleştirmedir. Etkisi fastcopy kullanıcı veri boyutunun ek fiziksel alan tüketmeden artırılmasıdır. Bu, sistem etkin sıkıştırma oranını artırır. Ne zaman birçok fastcopies yapılırsa, sistem etkili sıkıştırma oranı yapay olarak yüksek olabilir.
  • Sanal sentetikler
    • Sanal sentetik yedeklemeler, yüksek bir sistem etkin sıkıştırma oranı gösterme eğilimindedir. Bunun nedeni, sanal sentetiklerin mantıksal tam yedeklemeler yapması, ancak yalnızca değişen veya yeni verileri Data Domain sistemlerine aktarmasıdır. Sanal sentetiklerin sistem etkili sıkıştırma oranına etkisi, biraz fastcopy.
  • Geçersiz kılar
    • Üzerine yazmalar daha fazla fiziksel alan tüketir ancak veri kümesinin mantıksal boyutunu artırmaz, dolayısıyla üzerine yazmalar sistem etkin sıkıştırma oranını düşürür
  • Seyrek dosyaları depolama
    • Seyrek dosyalar, mantıksal boyuta dahil edilen ancak sıkıştırma nedeniyle fiziksel alan kullanmayan büyük "delikler" içerir. Sonuç olarak bu dosyalar, sistemde geçerli sıkıştırma oranını yüksek hale getirebilir.
  • Küçük dosyaları depolama
    • DDOS, belirli dahili meta veriler için her dosyaya yaklaşık 1 KB ek yük ekler. Bir sistem çok sayıda küçük dosya depoladığında (boyutları 1 KB'den küçük veya tek basamaklı kilobayt cinsinden), meta veri yükü etkin sıkıştırma oranını aşağı çeker.
  • Önceden sıkıştırılmış veya önceden şifrelenmiş dosyaları depolama
    • Sıkıştırma ve şifreleme, veri değişikliği düzeyini artırabilir ve tekilleştirme olasılığını azaltabilir. Bu tür dosyalar genellikle iyi bir şekilde tekilleştirilemez ve sistemin etkin sıkıştırma oranını düşürür.
  • Silme
    • Silme işlemleri sistemin mantıksal boyutunu düşürse de sistem, çöp toplama işlemi çalıştırılana kadar söz konusu kullanılmayan alanı geri kazanmaz. Silinen birçok dosya, Çöp Toplama (GC) çalıştırılana kadar sıkıştırma oranını düşürür.
  • Çöp Toplama (GC) veya Temizleme
    • GC, artık hiçbir dosya tarafından görülmeyen veri segmentleri tarafından tüketilen alanı geri alır. Yakın zamanda çok sayıda dosya silindiyse GC, fiziksel alan kullanımı ayak izini azaltarak sistem sıkıştırma oranını artırabilir.
  • Agresif bir şekilde anlık görüntüler alma
    • Bir anlık görüntü Mtree alınırsa, veri kümesinin mantıksal boyutu değiştirilmez. Ancak, anlık görüntü tarafından yakalanan tüm dosyalar anlık görüntü alındıktan sonra silinse bile anlık görüntü tarafından başvurulan tüm veri segmentleri kilitlenmelidir. GC, anlık görüntülerin hala ihtiyaç duyduğu alanı geri kazanamaz. Çok sayıda anlık görüntüye sahip olmak, sistemin etkin sıkıştırma oranının düşük görünmesine neden olabilir. Ancak anlık görüntüler, kilitlenme durumunda kurtarma için kullanışlıdır. Gerektiğinde anlık görüntü almaktan veya uygun anlık görüntü zamanlamaları ayarlamaktan asla çekinmeyin.

Sıkıştırma: Satır İçi İstatistikler:

DDOS, veri sisteme yazılırken tekilleştirmeyi satır içi olarak gerçekleştirir. Her yazma için satır içi tekilleştirme ve yerel sıkıştırmanın etkilerini izler ve istatistikleri dosya düzeyinde toplar. Dosya başına satır içi sıkıştırma istatistikleri mtree düzeyinde ve sistem düzeyinde. Sıkıştırma, satır içi istatistiklerdeki üç sayıya göre ölçülür:

  • Her yazmanın uzunluğu: raw_bytes 
  • The length of all unique segments: pre_lc_size
  • Yerel olarak sıkıştırılmış benzersiz segmentlerin uzunluğu: post_lc_size
Yukarıdaki üç sayıyı temel alarak, DDOS iki tane daha ince tanecikli sıkıştırma oranı tanımlar:
    • Genel sıkıştırma (g_comp)
      • Eşittir (raw_bytes/pre_lc_size) ve tekilleştirme oranını yansıtır
    • Yerel sıkıştırma (l_comp)
      • Eşittir (pre_lc_size/post_lc_size) ve yerel sıkıştırma algoritmasının etkisini yansıtır

Birikmiş satır içi sıkıştırma istatistikleri, DDOS'daki dosya meta verilerinin bir parçasıdır ve dosyada depolanır inode. DDOS, her üç düzeyde de satır içi sıkıştırmaları kontrol etmek için araçlar sağlar; Dosya MTreeve sistem genelinde. Bunlar aşağıdaki bölümlerde ayrıntılı olarak açıklanmıştır.

Dosya Sıkıştırma:

    • Dosya sıkıştırma, "filesys show compression <path>" Dosyada depolanan birikmiş sıkıştırma istatistiklerini bildiren CLI komutu inode.
    • Bir dizin belirtildiğinde, bu dizin altındaki tüm dosyaların satır içi sıkıştırma istatistikleri toplanır ve raporlanır.
    • CLI çıkışında, raw_bytes "Orijinal Bayt" olarak etiketlenir, pre_lc_size "Küresel Olarak Sıkıştırılmış" olarak etiketlenir. post_lc_bytes "Yerel Olarak Sıkıştırılmış" olarak işaretlenir. Diğer ek yükler "meta veriler" olarak bildirilir. İki örnek, bir üretim DD'sinden alınmıştır:

Örnek 1: Bir dosyanın satır içi sıkıştırma istatistikleri

filesys show compression /data/col1/main/dir1/file_1
Total files: 1;  bytes/storage_used: 7.1
        Logical Bytes:       53,687,091,200
       Original Bytes:       11,463,643,380
  Globally Compressed:        4,373,117,751
   Locally Compressed:        1,604,726,416
            Meta-data:           18,118,232

Örnek 2: Tüm alt dizinler dahil olmak üzere bir dizin altındaki tüm dosyaların satır içi sıkıştırma istatistikleri

filesys show compression /data/col1/main/dir1 
Total files: 13;  bytes/storage_used: 7.1
        Logical Bytes:       53,693,219,809
       Original Bytes:       11,501,978,884
  Globally Compressed:        4,387,212,404
   Locally Compressed:        1,608,444,046
            Meta-data:           18,241,880
      • Sistem, yukarıdaki CLI çıktısındaki genel satır içi sıkıştırma oranını "bytes/storage_used " çıktısıdır.
      • Ancak yukarıdaki bilgiler çeşitli nedenlerle yanıltıcı olabileceğinden, söz konusu bilgiler dikkatli bir şekilde yorumlanmalıdır.
      • Bunun bir nedeni, pre_lc_size ve post_lc_size veri işlemlerinin işlendiği anda kaydedilir.
      • Bu segmentleri ilk ekleyen dosya silindiğinde, kalan dosyadaki benzersiz veri segmentlerinin sayısı artırılmalıdır.

Örneğin, bir dosya örnek dosyasının bir Data Domain'e yedeklendiğini ve ilk yedeklemede dosyanın sıkıştırma bilgilerinin pre_lc_size= 10 GiB, post_lc_size= 5 Gib.

      • Ardından, bu dosyanın verilerinin benzersiz olduğunu ve başka herhangi bir dosyayla veri paylaşmadığını varsayalım.
      • Dosyanın ikinci yedeklemesinde, dosyanın ideal tekilleştirmeye sahip olduğunu varsayın, böylece her ikisi de pre_lc_size ve post_lc_size dosyanın tüm segmentleri sistemde zaten mevcut olduğundan sıfır olmalıdır.
      • İlk yedek silindiğinde, dosyanın ikinci yedeği 5 GiB veri segmentine başvuran tek dosya olur.
      • Bu durumda, ideal olarak, pre_lc_size ve post_lc_size ikinci yedeklemedeki dosyanın her ikisi de sıfırdan sırasıyla 10 GiB ve 5 GiB olacak şekilde güncellenmelidir.
      • Ancak bunun hangi dosyalar için yapılması gerektiğini algılamanın bir yolu yoktur, bu nedenle mevcut dosyaların satır içi sıkıştırma istatistikleri değişmeden kalır.
    • Yukarıdaki sayıları etkileyen bir diğer faktör de kümülatif istatistiklerdir.
    • Bir dosya çok fazla üzerine yazma işlemi aldığında, kümülatif istatistiklerin canlı verileri tanıtan yazmaları ne ölçüde yansıttığını izlemek imkansızdır.
    • Bu nedenle, uzun bir süre boyunca, satır içi sıkıştırma istatistikleri, yalnızca belirli bir dosyanın sıkıştırmasını kabaca tahmin etmek için bir buluşsal yöntem olarak ele alınabilir.
    • Vurgulanmaya değer bir başka gerçek de, bir dosyanın satır içi sıkıştırmasının rastgele bir zaman aralığı için ölçülememesidir.
    • Dosya satır içi sıkıştırma istatistikleri kümülatif bir sonuçtur ve dosyanın şimdiye kadar aldığı tüm yazmaları kapsar.
    • Bir dosya çok sayıda üzerine yazma işlemi aldığında, raw_bytes dosyanın mantıksal boyutundan çok daha büyük olabilir. Seyrek dosyalar için dosya boyutları "Orijinal Bayt"tan daha büyük olabilir.

MTree Compression:

    • Belirli bir sıkıştırmanın mtree ile kontrol edilebilir "mtree show compression" (MSC) CLI komutunu kullanın.
    • Dahili sıkıştırma istatistiklerinin mutlak değerleri, ürünün kullanım ömrü boyunca kümülatiftir. MTree.
    • Ömrünün bir MTree uzun yıllar sürebilir, bu değerler zamanla daha az bilgilendirici hale gelir.
    • Bu sorunu gidermek için satır içi sıkıştırma istatistiklerindeki değişiklik miktarı (deltalar) kullanılır ve sıkıştırma yalnızca belirli zaman aralıkları için rapor edilir.
    • Temel yaklaşım, MTree Satır içi sıkıştırma istatistikleri düzenli aralıklarla bir günlüğe kaydedilir.
    • Bir istemci ile MTree sıkıştırmasını sorguladığında MSC komutu, sıkıştırma raporlaması için sayıların deltalarını hesaplamak için günlük kullanılır.
    • Varsayılan olarak, MSC Son 7 gün ve son 24 saat için sıkıştırmayı bildirir, ancak ilgilenilen herhangi bir zaman dilimi belirtilebilir.

Bunu göstermek için aşağıdaki günlüğü varsayalım: MTree C:

3:00AM, raw_bytes=11000GB, pre_lc_size=100GB, post_lc_size=50GB 4:00AM, raw_bytes=12000GB, pre_lc_size=200GB, post_lc_size=100GB

Daha sonra sıkıştırması MTree Bu saat için A:

g_comp = (12000-11000)/(200-100) = 10x
l_comp = (200-100)/(100-50) = 2x
overall compression ratio = (12000-11000)/(100-50) = 20x

Yukarıdaki sıkıştırma oranı hesaplaması, veri kümesi boyutuyla hiçbir şey yapmaz. Örneğin, yukarıdaki mtree yalnızca 500 GB mantıksal veriye sahip olabilir.

    • MSC "Günlük" ve "Günlük Ayrıntılı" seçeneklerini destekler.filesys show compression" komutunu kullanın.
    • daily" belirtildiğinde, komut günlük sıkıştırmayı takvim biçiminde bildirir.
    • Günlük deltalarını kullanır. raw_bytes ve post_lc_size günlük sıkıştırma oranını hesaplamak için.
    • "daily-detailed" belirtildiğinde, komut üç deltayı da gösterir ( raw_bytes, pre_lc_sizeve post_lc_size, sırasıyla) her gün için. Ayrıca g_comp ve l_comp toplam sıkıştırma faktörünün yanı sıra.

Bu sistemlerden örnek bir çıktı aşağıdaki Ek'te yer almaktadır.

Sistem Sıkıştırması:

    • Sıkıştırmanın nasıl bildirildiğini bir kez MTrees anlaşıldığı gibi, kavramı tüm sisteme yaymak kolaydır.
    • Sistem genelinde sıkıştırma, satır içi istatistiklerin toplanması ve raporlanması, ile tam olarak aynıdır MTrees.
    • Tek fark, belirli bir alanda olduğu gibi kapsamdır. MTree, biri tüm sistemin üzerindeyken.
    • Sonuçlar " kullanılarak kontrol edilebilir.filesys show compression" komutunu kullanın.
    • Bunun bir örneği Bölüm 2'de bulunabilir.
    • "Son 7 gün" ve "son 24 saat" sistem sıkıştırması, FSC komutunun bir parçası olan faydalı komutlar listelenmektedir.

Bulut Katmanı:

  • Bulut katmanı uygulanmış DD'lerde depolama, iki bağımsız tekilleştirme etki alanı olan aktif katmana ve bulut katmanına ayrılır.
  • Kullanıcılar verileri yalnızca aktif katmana ekleyebilir.
  • Daha sonra, verileri aktif katmandan bulut katmanına geçirmek için DDOS veri taşıma işlevleri kullanılabilir.
  • Böylece alan ve sıkıştırma ölçümü ve raporlaması her katmanda bağımsız olarak ele alınır.
  • Ancak dosya düzeyinde, katmana göre ayrım yapılmaz ve satır içi sıkıştırma istatistikleri raporlar, Bölüm 3.1'de açıklananlarla tamamen aynıdır.

Deduplication:

Vurgulanması gereken son konu, birçok Data Domain makalesinde "genel sıkıştırma" olarak adlandırılan tekilleştirmenin bazı özellikleridir.

"Sıkıştırma" kelimesini içermesine rağmen, DDOS tarafından "yerel sıkıştırma" adı altında da sağlanan geleneksel sıkıştırma kavramından tamamen farklıdır.

  • Yerel sıkıştırma, belirli bir algoritma kullanarak bir veri parçasının boyutunu azaltır (bazı veri türleri sıkıştırılamaz ve üzerlerine sıkıştırma algoritmaları uygulamak veri boyutunu biraz artırabilir).
  • Genellikle, bir algoritmaya karar verildikten sonra, veriler sıkıştırma oranının tek faktörüdür.
  • Bununla birlikte, tekilleştirme farklıdır - yerel bir kavram değil, "küresel" dir.
  • Gelen bir veri segmenti, bulut olmayan Data Domain sistemlerindeki tüm verileri içeren, tekilleştirilmiş bir etki alanındaki mevcut tüm veri segmentleriyle karşılaştırılarak tekilleştirilir.
  • Tekilleştirme prosedüründe veri segmentinin kendisi önemli değildir.
  • Uygulamada, bir veri kümesinin ilk yedeklemesinde yüksek bir tekilleştirme oranı nadiren görülür. İlk yedeklemelerde veri azaltımı çoğunlukla yerel sıkıştırma ile sağlanır.
  • Sonraki yedeklemeler Data Domain'e ulaştığında tekilleştirme gücünü gösterir ve sıkıştırma için baskın faktör haline gelir.
  • Tekilleştirmenin etkinliği, bir veri kümesinin değişiklik hızının yedeklemeden yedeklemeye düşük olmasına dayanır. Bu nedenle, yüksek değişim oranlarına sahip veri kümeleri iyi bir şekilde tekilleştirilemez.
  • Yedekleme uygulaması, kendi meta veri öbeklerini (Data Domain tarafından işaretleyiciler olarak adlandırılır) yedekleme görüntülerine yüksek frekansta eklediğinde de iyi bir tekilleştirme oranı elde edemeyebilir. İşaretleyici işleme tekniklerimiz her zaman olmasa da bazen yardımcı olabilir.

Bu gözlemler göz önüne alındığında, ne beklemeli:

  • İlk yedeklemeler, genellikle 2x veya 3x olmak üzere yalnızca küçük bir sistem etkin sıkıştırma oranı elde edebilir. Deduplicate genellikle ilk yedeklemelerde gücünü göstermek için çok az fırsata sahiptir.
  • Artımlı bir yedeklemenin genel sıkıştırma oranı, tam yedeklemenin sıkıştırma oranından daha düşüktür. Bunun nedeni, kendinden hemen önceki yedekle karşılaştırıldığında artımlı yedeklemenin yalnızca değiştirilmiş veya yeni dosyaları içermesidir. Genel sıkıştırma oranı, artımlı yedeklemedeki yeni verilerin yüzdesine bağlıdır.
  • Tam yedeklemenin (başlangıçta olmayanlar) tekilleştirme oranı da bazı senaryolarda düşük olabilir. Sık gözlemlenen bazı senaryolar şunlardır:
    • Yedeklenen verilerde yüksek bir değişim oranı
    • Küçük dosyaların hakim olduğu veri kümesi (5 MiB'den az)
    • Çok sayıda yakın aralıklı işaretçi ekleyen yedekleme uygulamaları
    • Artımlı veya küçük blok boyutu kullanan veritabanı yedeklemeleri
    • Düşük veri değişim hızına sahip bir tam yedeklemede düşük bir sıkıştırma oranı gözlemlendiğinde yukarıdaki durumlardan birinin geçerli olup olmadığını veya daha fazla analiz gerekip gerekmediğini kontrol edin.
  • Daha sonraki bir yedekleme görüntüsünün sıkıştırılması her zaman ilkinden daha iyi değildir. İlk ve önceki yedekleme görüntüleri zaten verilerin çoğunu sisteme eklediğinden, ardışık yedekleme görüntüleri yüksek bir tekilleştirme oranı gösterebilir. Daha önceki tüm yedekleme görüntüleri silindiğinde, mevcut en eski yedekleme görüntüsünün genel ve yerel sıkıştırma oranı hala yüksek olabilir, ancak bu yalnızca sisteme eklendiğinde iyi bir tekilleştirme elde ettiği anlamına gelir, başka bir şey değil. Yüksek genel ve yerel sıkıştırma oranına sahip olan ve belirli bir veri kümesinin son yedek görüntüsü olan bir dosya silindiğinde, sıkıştırma oranından elde edilen boyuttan daha fazla alan serbest bırakabilir.
  • Aynı veri kümesinin farklı sistemlerdeki sıkıştırma oranları, veri kümesinin bu sistemlere eklenme şeklinden bağımsız olarak karşılaştırılamaz. Bunun nedeni, her sistemin bağımsız bir tekilleştirme etki alanı olmasıdır. Veri kümeleri aynı olsa bile iki farklı DD'nin aynı veya hatta mutlaka benzer sıkıştırma oranlarına sahip olması beklenmez.

Özet:

  • Sıkıştırmayı ölçmek, tekilleştirilmiş dosya sistemlerinde zordur, ancak günlük yapılı tekilleştirilmiş dosya sistemlerinde daha da zordur.
  • Tekilleştirmenin nasıl çalıştığı ve sıkıştırma istatistiklerinin nasıl izlendiği anlaşılmalıdır.
  • Sıkıştırma oranları, belirli bir sistemin davranışını anlamak için yararlı bilgilerdir.
  • Sistem etkin sıkıştırma oranı en önemli, güvenilir ve bilgilendirici ölçüdür.
  • Satır içi sıkıştırma istatistikleri de yardımcı olabilir, ancak bazı durumlarda buluşsal yöntemlerden başka bir şey olmayabilir.

Ek:

Örnek çıktı: "mtree show compression" komut

  • Bir olduğunu varsayalım MTree 254792.4 GiB veri tutuyor. Son 7 günde 4379,3 GiB ve son 24 saatte 78,4 GiB yeni veri aldı (diğer zaman aralıkları belirtilebilir).
  • "Daily" (günlük) seçeneği son 33 güne ait satır içi sıkıştırma istatistiklerini raporlar.
  • "Günlük ayrıntılı" seçeneği sağlandığında, toplam sıkıştırma oranları, global ve yerel sıkıştırma oranlarına ayrılarak daha da ayrıntılı hale getirilir.

Komutta mtree Liste çıktısı:

mtree list /data/col1/main 
Name              Pre-Comp (GiB)   Status
---------------   --------------   ------
/data/col1/main         254792.4   RW
---------------   --------------   ------
 D    : Deleted
 Q    : Quota Defined
 RO   : Read Only
 RW   : Read Write
 RD   : Replication Destination
 IRH  : Retention-Lock Indefinite Retention Hold Enabled
 ARL  : Automatic-Retention-Lock Enabled
 RLGE : Retention-Lock Governance Enabled
 RLGD : Retention-Lock Governance Disabled
 RLCE : Retention-Lock Compliance Enabled
 M    : Mobile
 m    : Migratable

MSC (seçenek yok):

mtree show compression /data/col1/main
From: 2023-09-07 12:00 To: 2023-09-14 12:00

                Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                   (GiB)       (GiB)        Factor       Factor          Factor
                                                                  (Reduction %)
-------------   --------   ---------   -----------   ----------   -------------
Written:
  Last 7 days     4379.3       883.2          3.4x         1.5x     5.0x (79.8)
  Last 24 hrs      784.6       162.1          3.3x         1.4x     4.8x (79.3)
-------------   --------   ---------   -----------   ----------   -------------

"Günlük" seçeneğiyle:

mtree show compression /data/col1/main daily
From: 2023-08-12 12:00 To: 2023-09-14 12:00

  Sun     Mon     Tue     Wed     Thu     Fri     Sat   Weekly
-----   -----   -----   -----   -----   -----   -----   ------   -----------------
 -13-    -14-    -15-    -16-    -17-    -18-    -19-            Date
432.0   405.9   284.1   438.8   347.0   272.7   331.4   2511.8   Pre-Comp
 85.5    66.2    45.3    81.9    61.4    57.4    66.3    464.1   Post-Comp
 5.0x    6.1x    6.3x    5.4x    5.7x    4.7x    5.0x     5.4x   Total-Comp Factor

 -20-    -21-    -22-    -23-    -24-    -25-    -26-
478.0   387.8   450.2   533.1   386.0   258.4   393.6   2887.1
100.6    81.5   100.8   119.0    84.0    40.6    75.3    601.8
 4.8x    4.8x    4.5x    4.5x    4.6x    6.4x    5.2x     4.8x

 -27-    -28-    -29-    -30-    -31-     -1-     -2-
 27.6     1.0     0.4   470.7   467.3   517.7   641.9   2126.7
  4.9     0.2     0.1    83.9    92.3    89.8   140.1    411.2
 5.6x    5.6x    4.3x    5.6x    5.1x    5.8x    4.6x     5.2x

  -3-     -4-     -5-     -6-     -7-     -8-     -9-
539.6   495.0   652.8   658.7   537.1   398.7   305.5   3587.3 
110.8   108.0   139.4   137.0   111.5    78.3    48.3    733.3 
 4.9x    4.6x    4.7x    4.8x    4.8x    5.1x    6.3x     4.9x 

 -10-    -11-    -12-    -13-    -14-   
660.2   738.3   787.2   672.9   796.9                   3655.5
143.9   152.5   167.6   126.9   163.3                    754.2 
 4.6x    4.8x    4.7x    5.3x    4.9x                     4.8x 
-----   -----   -----   -----   -----   -----   -----   ------   -----------------
                 Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                    (GiB)       (GiB)        Factor       Factor          Factor
                                                                   (Reduction %)
--------------   --------   ---------   -----------   ----------   -------------
Written:
  Last 33 days    14768.3      2964.5          3.4x         1.5x     5.0x (79.9)
  Last 24 hrs       784.6       162.1          3.3x         1.4x     4.8x (79.3)
--------------   --------   ---------   -----------   ----------   -------------

Key:
       Pre-Comp = Data written before compression
       Post-Comp = Storage used after compression
       Global-Comp Factor = Pre-Comp / (Size after de-dupe)
       Local-Comp Factor = (Size after de-dupe) / Post-Comp
       Total-Comp Factor = Pre-Comp / Post-Comp
       Reduction % = ((Pre-Comp - Post-Comp) / Pre-Comp) * 100

"Günlük ayrıntılı" seçeneği ile:

mtree show compression /data/col1/main daily-detailed 
From: 2023-08-12 12:00 To: 2023-09-14 12:00

  Sun     Mon     Tue     Wed     Thu    Fri     Sat    Weekly
-----   -----   -----   -----   -----   -----   -----   ------   -----------------
 -13-    -14-    -15-    -16-    -17-    -18-    -19-            Date
432.0   405.9   284.1   438.8   347.0   272.7   331.4   2511.8   Pre-Comp
 85.5    66.2    45.3    81.9    61.4    57.4    66.3    464.1   Post-Comp
 3.5x    4.1x    4.3x    3.6x    3.8x    3.3x    3.4x     3.7x   Global-Comp Factor
 1.4x    1.5x    1.5x    1.5x    1.5x    1.4x    1.5x     1.5x   Local-Comp Factor
 5.0x    6.1x    6.3x    5.4x    5.7x    4.7x    5.0x     5.4x   Total-Comp Factor
 80.2    83.7    84.1    81.3    82.3    78.9    80.0     81.5   Reduction %

 -20-    -21-    -22-    -23-    -24-    -25-    -26-
478.0   387.8   450.2   533.1   386.0   258.4   393.6   2887.1
100.6    81.5   100.8   119.0    84.0    40.6    75.3    601.8
 3.3x    3.3x    3.0x    3.0x    3.3x    4.1x    3.6x     3.3x 
 1.4x    1.5x    1.5x    1.5x    1.4x    1.5x    1.4x     1.5x 
 4.8x    4.8x    4.5x    4.5x    4.6x    6.4x    5.2x     4.8x
 79.0    79.0    77.6    77.7    78.2    84.3    80.9     79.2

 -27-    -28-    -29-    -30-    -31-    -1-     -2-
 27.6     1.0     0.4   470.7   467.3   517.7   641.9   2126.7
  4.9     0.2     0.1    83.9    92.3    89.8   140.1    411.2
 4.4x    3.7x    2.6x    3.8x    3.5x    3.9x    3.2x     3.5x 
 1.3x    1.5x    1.6x    1.5x    1.4x    1.5x    1.5x     1.5x
 5.6x    5.6x    4.3x    5.6x    5.1x    5.8x    4.6x     5.2x
 82.1    82.2    76.8    82.2    80.3    82.7    78.2     80.7

  -3-     -4-     -5-     -6-     -7-    -8-     -9-
539.6   495.0   652.8   658.7   537.1   398.7   305.5   3587.3 
110.8   108.0   139.4   137.0   111.5    78.3    48.3    733.3 
 3.4x    3.1x    3.2x    3.4x    3.3x    3.4x    4.1x     3.3x 
 1.4x    1.5x    1.5x    1.4x    1.4x    1.5x    1.6x     1.5x
 4.9x    4.6x    4.7x    4.8x    4.8x    5.1x    6.3x     4.9x 
 79.5    78.2    78.6    79.2    79.2    80.4    84.2     79.6

 -10-    -11-    -12-    -13-    -14-   
660.2   738.3   787.2   672.9   796.9                   3655.5
143.9   152.5   167.6   126.9   163.3                    754.2
 3.1x    3.4x    3.2x    3.7x    3.4x                      .3x 
 1.5x    1.4x    1.5x    1.4x    1.5x                     1.5x
 4.6x    4.8x    4.7x    5.3x    4.9x                     4.8x
 78.2    79.3    78.7    81.1    79.5                     79.4
-----   -----   -----   -----   -----   -----   -----   ------   -----------------
                 Pre-Comp   Post-Comp   Global-Comp   Local-Comp      Total-Comp
                    (GiB)       (GiB)        Factor       Factor          Factor
                                                                   (Reduction %)
--------------   --------   ---------   -----------   ----------   -------------
Written:
  Last 33 days    14768.3      2964.5          3.4x         1.5x     5.0x (79.9)
  Last 24 hrs       784.6       162.1          3.3x         1.4x     4.8x (79.3)
--------------   --------   ---------   -----------   ----------   -------------

Key:
       Pre-Comp = Data written before compression
       Post-Comp = Storage used after compression
       Global-Comp Factor = Pre-Comp / (Size after de-dupe)
       Local-Comp Factor = (Size after de-dupe) / Post-Comp
       Total-Comp Factor = Pre-Comp / Post-Comp
       Reduction % = ((Pre-Comp - Post-Comp) / Pre-Comp) * 100

Produits concernés

Data Domain

Produits

Data Domain
Propriétés de l’article
Numéro d’article: 000003886
Type d’article: How To
Dernière modification: 17 Jun 2026
Version:  24
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.