Avamar: Kapasite Yönetimi Kavramları ve Eğitimi
Summary: Bu makale, Avamar kullanıcısına ve işletim sistemi Kapasite Yönetimine yöneliktir. Avamar sistem yöneticileri veya bir Avamar ızgarasının sağlığını izleyen ve işletim sistemi ve Kullanıcı Kapasitesi düzeylerinin nasıl yönetileceği konusunda nasıl çalışılacağını bilen kişiler tarafından kullanılmak üzere tasarlanmıştır. ...
Symptoms
Bu makalenin amaçları:
- /data* bölümlerinde depolanan veri türlerini özetleme.
- "İşletim sistemi kapasitesi" kavramını tanımlama ve bu kavram ile "Kullanıcı Kapasitesi" kavramı (bazen "GSAN Kapasitesi" olarak adlandırılır) arasındaki farkları ortaya koyma.
- Avamar'ın neden Kullanıcı Kapasitesi sınırına yakın bir değerde çalıştırılmaması gerektiğini açıklama.
- Kontrol noktası ek yükünü artıran unsurları listeleme.
- Veri bölümü kullanımının nasıl izleneceğini açıklama.
- İşletim sistemi kapasitesi kontrol edilemez hale geldiğinde görülen belirtileri açıklama.
- Mesajın tipik nedenlerini
MSG_ERR_DISKFULLlisteleme. - Yüksek işletim sistemi kapasitesinin normal sistem çalışmasını etkilediği durumlarda kullanılan kurtarma yöntemlerini ana hatlarıyla açıklama.
- Kullanıcı Kapasitesinin Kullanıcı kapasite sınırını aşması halinde görülen belirtileri açıklama.
- Yüksek Kullanıcı Kapasitesi durumundan nasıl kurtulunacağını anlatma.
Bu makalede, okuyucunun Avamar Operasyonel En İyi Uygulamalar Kılavuzu'nun (İngilizce) "Kapasite Yönetimi" bölümü hakkında bilgi sahibi olduğu varsayılmaktadır.
İşletim ortamınız ile ilgili kılavuzlar Dell Desteği sitesinde Avamar belgelerini bulma bölümünde yer almaktadır.
Çok yüksek "işletim sistemi kapasitesi" durumunu etkileyen veya bu durumun belirtileri olan yaygın sorunlar şunlardır:
- Kontrol noktası doğrulamasının (hfscheck) başarısız olması.
- Çöp toplama işleminin çalıştırılamaması ve MSG_ERR_DISKFULL mesajı vermesi.
- Kontrol noktası oluşturma işlemlerinin başarısız olması.
- Yedeklemelerin başarısız olması.
- Gelen çoğaltma işlerinin başarısız olması.
- Yönetici arayüzünün, yedekleme süresi boyunca sistemi "Admin" (Yönetici) modunda göstermesi.
Cause
Resolution
Avamar ızgarasında veriler nasıl saklanır?
Avamar kapasite yönetimi, tüm Avamar veri düğümlerinin /data* bölümlerindeki verilere yöneliktir. Buna aşağıdakiler dâhildir:
- Tekilleştirilmiş yedekleme verileri
- RAIN eşlik verileri
- Kontrol noktası ek yükü verileri
Çöp toplama ve asenkron şerit işlemesi gibi bakım görevlerinin doğru şekilde çalışması için de veri bölümlerinde boş alan gereklidir.
Aşağıda, Avamar depolama düğümlerindeki veri bölümlerinin içinde yer alan fiziksel depolama alanının grafiksel bir gösterimi verilmiştir.
Veri bölümlerinde veriler nasıl saklanır?
Yukarıdaki şemada, veri bölümlerindeki boş alanın nasıl kullanıldığı basit bir şekilde gösterilmektedir.
Soldaki %100 değeri, veri bölümlerindeki işletim sisteminde kullanılabilir olan toplam fiziksel alan miktarı olarak tanımlanır.
Veri bölümlerinin herhangi biri toplam alanın %85'inden fazlasını kullandığı takdirde çöp toplama çalıştırılamaz.
%100 Kullanıcı Kapasitesi işareti (salt okunur sınır), veri bölümündeki toplam alanın en fazla %65'inin tekilleştirilen verilerin depolanması için kullanılabileceğini gösterir. Bu %100 Kullanıcı kapasitesi işaretinin altındaki alan, Administrator UI'de görünen Sunucu Kullanımı değerine eşdeğerdir. Herhangi bir düğümdeki herhangi bir veri bölümünde depolanan tekilleştirilmiş veri miktarı %65'e ulaşırsa Avamar sistemi salt okunur olur ve daha fazla yedekleme verisi kabul etmez.
Artık Avamar Administrator kullanıcı arayüzünden, kullanıcının yedeklemelerin kullandığı alanı görebildiğini ancak işletim sisteminin veri bölümlerinde kullanılan alanı göremediğini anlayabiliriz.
Avamar sistemi neden "Kullanıcı Kapasitesi" sınırına yakın bir kapasite ile çalıştırılmamalıdır?
Yüksek "Kullanıcı Kapasitesi" ve kontrol noktası ek yükü arasındaki ilişkiye göre, bir sistem giderek daha fazla dolduğunda yedekleme verilerdeki küçük artışlar bile kontrol noktası ek yükünde büyük artışlara neden olabilir.
Bunun nedenine yönelik ayrıntılı açıklamalar bu makalenin kapsamı dışındadır ancak unutulmaması gereken en önemli durum şudur: Bir Avamar sistemi %100 Kullanıcı Kapasitesine yaklaştıkça kontrol noktası ek yükü için kullanılabilen işletim sistemi kapasitesi azalır.
Yukarıdaki şemada görüldüğü gibi, tamamen dolu bir sistemde kontrol noktası ek yükü, veri bölümlerindeki toplam işletim sistemi alanının %20'si ile sınırlıdır.
Bir Avamar sisteminin yüksek "Kullanıcı Kapasitesi" düzeylerinde güvenilir bir şekilde çalıştırılması için aşağıdaki kriterlerin karşılanması gerekir:
- Sistemdeki günlük olarak değiştirilen veri oranı düşük olmalıdır (en fazla %1).
- Kapasite dengeli bir durumda olmalıdır (Avamar Operasyonel En İyi Uygulamalar Kılavuzu'nun "Kapasiteyi Yönetme" bölümünde açıklandığı şekilde). İşletim ortamınıza ilişkin rehberleri burada bulabilirsiniz: Dell Desteği sitesinde Avamar belgelerini bulma.
- Bakım görevleri günlük olarak başarıyla tamamlanmalıdır.
Kontrol noktası ek yükünü artıran unsurlar:
Aşağıdaki unsurlar kontrol noktası ek yükünün artmasına neden olabilir.
- Asenkron şerit işlemesi (varsayılan olarak etkindir)
- Sistemde saklanan kontrol noktası sayısı
- Kontrol noktası doğrulaması günlük olarak başarıyla tamamlanmıyor.
- Avamar sunucusu şeritleri yeniden kullandığında şeritlerin ne kadar boş olduğu (daha yüksek sunucu kullanımıyla daha şiddetli hale gelir)
- Günlük yedekleme değiştirme hızı<
Veri bölümü kullanımını izleme:
İşletim sistemi veri bölümü kullanımını izlemenin doğru yolu, Avamar Yardımcı Yazılım Düğümünden aşağıdaki Avamar komutunu kullanmaktır.
Örneğin:
admin@utilitynode:~/>: avmaint nodelist | grep fs-percent
fs-percent-full="7.8"
fs-percent-full="6.3"
fs-percent-full="6.4"
fs-percent-full="6.4"
fs-percent-full="7.6"
fs-percent-full="6.2"
fs-percent-full="6.1"
fs-percent-full="6.6"
fs-percent-full="7.8"
fs-percent-full="6.4"
fs-percent-full="6.5"
fs-percent-full="6.8"
Bu çıktı, işletim sistemi kapasite kullanımının gerçek değerlerini sağlar. Veri düğümlerinin dosya havuzu kullandığı bir ızgarada, Linux df komutu anlamlı değildir çünkü şeritler dosya havuzunda önceden ayrılmıştır ve çoğu kullanımda olmayabilir.
İşletim sistemi kapasite kullanımı kontrol edilemez hale gelirse ne olur?
Kullanıcı bakış açısından veri bölümü kullanımının kontrol edilemez hale geldiğinin ilk göstergesi, kullanımın %85'in üzerine çıkmasıdır.
Çöp toplama işlemi artık çalıştırılamaz ve bir hata mesajı vererek
MSG_ERR_DISKFULL başarısız olur.
Bu konuda yanlış anlaşılmaların sıklıkla görüldüğü durumlar şöyledir: Kullanıcı, mesajı
MSG_ERR_DISKFULL genellikle sistemin yedeklemeler için artık boş alana sahip olmadığı şeklinde yorumlar.
Bu yorum doğru değildir ancak kullanıcı genellikle Avamar Administrator kullanıcı arayüzündeki sunucu kullanımı değerini kontrol eder ve değerin kabul edilebilir düzeyde (örneğin %60) olduğunu öğrenir.
Kullanıcı, Avamar kullanıcı arayüzünün Yedekleme yönetimi arayüzünden yedeklemeleri silmeye çalışabilir. Kullanıcı Kapasitesi düzeyi yüksek olsa bile çöp toplama işlemi çalıştırılamadığından ve süresi dolmuş veri parçalarını sistemden kaldıramadığından yedeklemelerin silinmesi durumu düzeltmeyecektir.
Bir sistemde hem yüksek işletim sistemi kapasitesi sorunu hem de yüksek Kullanıcı Kapasitesi sorunu yaşanıyorsa öncelikle yüksek işletim sistemi kapasitesi sorununu çözmeye odaklanın.
İşletim sistemi kapasite kullanımının yüksek olması durumunda sistem, kontrol noktaları oluşturmak için yeterli alana sahip olamayabilir.
MSG_ERR_DISKFULL mesajı neden görülür?
En sık karşılaşılan neden, kontrol noktası ek yükünün çok yüksek olmasıdır. Yüksek kontrol noktası ek yükünün yaygın nedenleri şunlar olabilir:
- Kontrol noktası doğrulaması (hfscheck) tekrar tekrar başarısız olmuştur.
- hfscheck hatası olası birçok kök nedene sahiptir (aniden iptal, yazılım hatası vb.).
- Sistem çok dolu olarak çalışıyordur ve sistemin günlük veri değiştirme oranı yüksektir.
- Sistem, veri değiştirme oranını karşılayabilmek ve verileri saklamak için daha fazla veri düğümüne ihtiyaç duyar.
- Sistem, boyutuna göre daha fazla veri veya istemciyi yedeklemek üzere yapılandırılmıştır.
- Çok fazla sayıda kontrol noktası depolanmaktadır (Avamar, biri doğrulanmış olmak üzere varsayılan olarak iki kontrol noktası depolar).
- Sistem yöneticisi fazla kontrol noktası oluşturmuştur.
- Kısa süre önce bakım gerçekleştirilmiş ancak varsayılan kontrol noktası saklama işlemleri yeniden uygulanmamıştır.
MSG_ERR_DISKFULL senaryosunun çözümlenmesine yardımcı olabilecek şu makaleye bakın: "Veri" bölümü işletim sistemi kapasitesinin >%89'dan fazla olması nedeniyle Avamar bakım görevlerinin "MSG_ERR_DISKFULL" mesajı vererek başarısız olması.
Yüksek işletim sistemi kapasitesini araştırmaya ve azaltmaya yönelik eylemler.
1. Son hfscheck işleminin ne zaman tamamlandığını belirleyin. Bu işlem Avamar Administrator veya Avamar Yardımcı Yazılım Düğümündeki komut satırı kullanılarak yapılabilir:
- Avamar Administrator'da Server (Sunucu) > Checkpoint Management (Kontrol Noktası Yönetimi) sekmesine gidin
- Checkpoint Validation (Kontrol Noktası Doğrulama) sütununda listelenen en güncel tarih ve saati kontrol edin. Bu işlem son 24 saat içinde gerçekleşmiş olmalıdır.
- Avamar Yardımcı Yazılım Düğümü komut satırını kullanarak şu komutu çalıştırın: cplist.
admin@utilitynode:~/>: cplist
cp.20110114111419 Fri Jan 14 11:14:19 2011 valid rol --- nodes 3/3 stripes 1131
cp.20110114194457 Fri Jan 14 19:44:57 2011 valid --- --- nodes 3/3 stripes 1131
Sonuçlara göre son doğrulanmış kontrol noktası 24 saatten önceyse bunun nedenini öğrenin. Bu durum HFScheck işleminin çalışmamış veya başarısız olmasından kaynaklanabilir.
2. HFScheck işleminin çalışıp çalışmadığını veya başarısız olup olmadığını doğrulayın.
Örneğin:
Last hfscheck: finished Sat Jan 15, 11:07:17 2011 after 06m 41s >> checked 528 of 528 stripes (OK)
.
admin@utilitynode:~/>: dpnctl status maint
Identity added: /home/admin/.ssh/dpnid (/home/admin/.ssh/admin_key)
dpnctl: INFO: Maintenance windows scheduler status: enabled.
- Bakım aralıkları zamanlayıcısı çalışmıyorsa, devre dışı bırakılmışsa veya askıya alınmışsa şu komutla etkinleştirin: dpnctl start maint
- İsteğe bağlı olarak yeni bir kontrol noktası alın ve hfscheck komutunu çalıştırın veya bir sonraki zamanlanmış bakım aralığının tamamlanmasını bekleyin.
Bir hfscheck işlemi başarıyla tamamlandığında (herhangi bir sorunu çözdükten veya bakım zamanlayıcısını yeniden başlattıktan sonra), en eski kontrol noktası "kaldırılır" ve işletim sistemi kapasitesi önemli ölçüde azalır.
- İşletim sistemi kapasitesi hâlâ çok yüksekse ve çöp toplama işlemi MSG_ERR_DISKFULL mesajı vererek başarısız olmaya devam ediyorsa Dell Teknik Destek ekibinden yardım isteyin.
- Öte yandan, işletim sistemi kapasitesi çöp toplama işleminin tamamlanmasına izin verecek kadar düşükse "Kullanıcı Kapasitesini" azaltmaya çalışın ve "sunucu kullanımı" değerini düşürün.
Yüksek Kullanıcı Kapasitesini azaltmaya yönelik eylemler:
Kullanıcı Kapasitesi düzeyleri, İşletim sistemi kapasitesinden farklı olarak Avamar sistem yöneticisinden daha doğrudan ve kolay bir şekilde etkilenir.
1. Çöp toplama işleminin her gün çalıştığından ve yedeklemeler nedeniyle kesintiye uğramadığından emin olun.
Bu en önemli noktalardan biridir çünkü çöp toplama işleminin düzenli ya da güvenilir bir şekilde çalışmaması halinde yeterli boyuttaki bir sistem bile hızla yüksek Kullanıcı Kapasitesi sorunuyla karşılaşacaktır.
Daha önce gösterildiği gibi bakım zamanının etkin olduğunu doğrulayın, ardından çöp toplama işleminin çalıştığını ve verilerin kaldırıldığını doğrulamak için capacity.sh ve sched.sh komut dosyalarını kullanın.
Avamar v7.x'ten önce, yedeklemeler çöp toplama "kısıtlama" aralığında çalıştırılamıyordu.
Avamar v7.x özelliği ile sunulan Hash Referenced Bit Maps (Karma Referanslı Bit Eşlemeleri) özelliği, yedeklemelerin çöp toplama bakım etkinliği sırasında gerçekleşmesine olanak tanır. Bu özellik, bu "haritaların" sıfırlanabilmeleri için yedeklemelerin çalıştırılmadığı günde en az 5 dakikalık "sessiz" süreye sahip olmasını gerektirir.
Bu özellik hakkındaki içeriğe şu makalenin bağlantısı kullanılarak erişilebilir: Avamar: Avamar v7'den itibaren Çöp Toplama, veriler kullanımdayken "Hash Referenced Bit Maps" (Karma Referanslı Bit Eşlemeleri) özelliği nedeniyle temizlenemeyen " atlanmış karmaları" rapor eder.
2. Izgaraya yeni istemciler eklemeyi durdurun.
Bir Avamar ızgarası kapasitesinin sonuna yaklaşıyorsa durumun kötüleşmesini önlemek için yeni istemciler eklemeyi hemen durdurmamız gerekir.
Daha düşük bir sunucu kullanım düzeyinde çalışan başka bir Avamar ızgaranız varsa yeni istemcileri, dolmakta olan sunucu yerine bu ızgaraya eklemeyi düşünebilirsiniz.
3. Hangi istemcilerin en fazla depolama alanı kullandığını öğrenin.
Kapasite sorunlarını gidermek için öncelikle Avamar sistemine en fazla veri ekleyen istemcileri belirlemeliyiz.
capacity.sh komut dosyası (Avamar Yardımcı Yazılım Düğümü komut satırından çalıştırılır), hangi istemcilerin en yüksek değişim hızına sahip olduğunu belirlemek için de kullanılabilir.
Kayıtlı Dell kullanıcıları şu makalenin bağlantısını kullanarak içeriğe erişebilir: Avamar: capacity.sh komut dosyasıyla kapasiteyi yönetme. Böylece capacity.sh komut dosyasını kullanma hakkında daha fazla bilgi edinebilirler.
En çok veri kullanan istemcilerin genellikle SQL veri tabanlarını veya e-posta sunucularını yedekleyen istemciler olduğu görülmüştür; dolayısıyla bu tür istemcilere özellikle dikkat edin.
4. Saklama politikalarını yeniden değerlendirin.
Yüksek değiştirme oranına sahip istemcileri tespit ettikten sonra saklama politikalarını yeniden değerlendirin ve bu politikaların depolama gereksinimlerini kabul edilebilir bir düzeye indirmek üzere düşürülüp düşürülemeyeceğini kontrol edin.
Sistem en uzun süre saklanan yedeklemelerin süresi dolmaya başlayacak kadar eskiyse saklama politikalarını düşürdükten sonra, çöp toplama işlemi yoluyla her gün kaldırılan veri miktarında bir artış bekliyoruz. Bu eğilimi capacity.sh komut dosyasıyla izleyin.
Avamar sistemi henüz yedeklemelerin süresi dolmaya başlayacak kadar eski değilse saklama politikalarının değiştirilerek, en eski yedeklemelerin artık süresinin dolmaya başlamasının sağlanması gerekebilir.
Yasal gereklilikler nedeniyle saklama politikalarını düşürmek mümkün değilse Avamar sistemini genişletmeyi veya istemcileri daha az kullanılan başka bir Avamar sistemine taşımayı düşünebilirsiniz.
5. İstemcileri alternatif bir Avamar sistemine taşıyın.
Başka bir Avamar sistemi mevcutsa Avamar Client Manager arayüzünü kullanarak büyük veya yüksek veri değiştirme hızına sahip istemcileri çok kullanılan sistemlerden daha az kullanılan sistemlere taşıma olanağını göz önünde bulundurun.
- Yeni Avamar sunucusunda, taşımak istediğiniz Avamar istemcilerine yönelik yeterli depolama alanı gereklidir.
- Tekilleştirme verimliliklerden yararlanmak için benzer türde verilere sahip istemcileri aynı Avamar sisteminde tutun.
- Bu strateji, Avamar sistemlerinin aynı yerel ağda bulunduğu durumlarda en iyi şekilde kullanılır.
6. Eski yedeklemeleri silin.
Kullanıcı Kapasitesi önemli bir düzeydeyse (>%90) Yedekleme Yönetimi arayüzü üzerinden veya modify-snapups aracıyla eski yedeklerin süresinin dolmasının sağlanması gerekebilir.
Dell kullanıcıları, şu makalenin bağlantısını kullanarak içeriğe erişebilir: Avamar Kapasite Yönetimi: "modify-snapups" aracını kullanarak yedeklemeleri toplu olarak silme veya yedeklemelerin süresinin dolmasını sağlama (İngilizce).
Yedeklemelerin silinmesi, sunucu kullanım düzeyini hemen düşürmez. Bu eylem, çöp toplama işleminin verileri bir sonraki çalıştırılmasında kaldırmasını sağlar. Eski yedeklemeleri silmek, kısa vadeli geçici bir çözümdür. İlerleyen günlerde bu yedeklemelerin yerini başka yedeklemeler alacaktır. Yedeklemeler silinirse saklama politikalarını da ayarlamak gerekir.
7. capacity.sh komut dosyasını kullanarak veri değişikliklerini izleyin.
Yedeklemeler silindikten ve saklama politikaları değiştirildikten sonra sistemdeki veri değişikliğini capacity.sh komut dosyasını kullanarak yakından izleyin. "Removed" (Kaldırılan) veri değerinin artmaya başladığını ve "Net Change" (Net Değişiklik) değerinin negatif olduğunu görebilirsiniz. Zamanla fazla veriler sistemden temizlenir ve "Removed" (Kaldırılan) değeri daha normal düzeylere inmeye başlar. "Removed" (Kaldırılan) değerini izlemeye devam edin.
Net değişiklik değeri negatif hale gelmezse çöp toplama işleminin ne kadar süredir çalışmakta olduğunu ve bakım süresi dahilinde ne kadar iş tamamladığını görmek için çöp toplama günlüğünü kontrol edin
Dell kullanıcıları şu makalenin bağlantısını kullanarak içeriğe erişebilir: Avamar: capacity.sh komut dosyasıyla kapasiteyi yönetme. Böylece capacity.sh komut dosyasını kullanma hakkında daha fazla bilgi edinebilirler.
8. Avamar sistemini genişletin:
Avamar sistemindeki yüksek kullanım genellikle doğal ve beklenen veri büyümesinden kaynaklanır. Üretim yedeklemelerine devam etmek için daha fazla alan kullanılabilir hale getirilmelidir.
Bunun nasıl yapılacağı Avamar sisteminin türüne bağlıdır.
- Tek düğümlü sistemler ve Avamar Virtual Edition (AVE) sistemleri
Bu sistemler genişletilemez. İkinci ve daha büyük bir Avamar sistemini kullanıma alın ve küçük sistemden bu büyük sisteme geçişi gerçekleştirmesi için Dell Profesyonel Hizmetler ekibine talepte bulunun. Profesyonel Hizmetler'e, Dell Hesap Yöneticisi aracılığıyla erişebilir.
Kaynaktan daha fazla depolama alanı sağladığı sürece yeni sistem; tek bir düğüm, AVE veya çok düğümlü bir sistem olabilir.
- Çok düğümlü sistemler
Bu sistemler 16 veri düğümüne kadar genişletilebilir. Ayrıntılı bilgi için Dell Hesap Yöneticisine başvurun. Normal destek kanalları düğüm ekleme işlemi yapmaz, bu nedenle bu işi talep etmek için bir Servis İsteği açılmamalıdır.
- Data Domain'i entegre etme
Bir Data Domain sistemini arka uç depolama aygıtı olarak entegre etmek, Avamar'a yedekleme yapan istemcilerin kullanılabilir kapasitesini genişletmek için kullanışlı bir yöntemdir. Dell Hesap Yöneticinizle birlikte seçenekleri değerlendirin.
Additional Information
Faydalı Araçlar
- status.dpn
- capacity.sh
- Avalanche
- DPN Özet Raporu
- replcnt.sh
- Avamar Client Manager
En İyi Uygulamalar:
-
Avamar Sunucu kullanımı (Kullanıcı Kapasitesi) değerinin %80'in üzerine çıkmasını önleyin.
-
Daha Düşük Kullanıcı Kapasitesi, eklenen veri miktarında beklenmeyen değişikliklere karşı dayanıklılık sunar ve bakım görevleriyle ilgili beklenmedik hatalar ya da kısa vadeli sorunlar oluşursa sistemin kullanılamaz hale gelmesine karşı koruma sağlar.
-
Kullanıcı Kapasitesinin %80'inin üzerinde çalışan bir Avamar sisteminde, bakım görevlerinin başarılı bir şekilde tamamlanmasını ve sistemin salt okunur duruma geçmemesini sağlamak için sistem yöneticisinin daha fazla izleme yapması gerekir.