PowerScale OneFS: Performans Sorunlarını Giderme
Summary: Gelişmiş küme verimliliği için InsightIQ ile ağ yapılandırması, işleme yükleri ve izleme hakkında kapsamlı bir kılavuzla PowerScale OneFS yavaş performans sorunlarını giderin.
Symptoms
İstemci bilgisayarlar yavaş çalışır. Özellikle kümede çalışan belirli işler başarısız olur veya beklenenden daha uzun sürer.
Cause
Performans sorunları genellikle ağ trafiği, ağ yapılandırma sorunları, istemci veya küme işleme yükü ya da bu faktörlerin bir kombinasyonundan kaynaklanır. Bu makalede, performans sorunlarını gidermenin birkaç etkili yolu açıklanmaktadır.
Resolution
InsightIQ ile sorun giderme
İçindekiler:
- Isilon InsightIQ'yu Kullanma
- InsightIQ olmadan sorun giderme
- Ağ üretilen iş
- İstemci bağlantılarının dağıtımı
- Küme aktarım hızı
- Küme işleme
- Sıraya alınan işlemler
- CPU
Isilon InsightIQ'yu Kullanma
Isilon InsightIQ kullanmak, performansı izlemenin ve performans sorunlarını gidermenin en iyi yoludur.
Isilon InsightIQ sanal cihazı, InsightIQ web tabanlı uygulamada esnek, özelleştirilebilir grafik görünümleri aracılığıyla Isilon küme etkinliğini izlemenizi ve analiz etmenizi sağlar. Bu grafikler, küme donanımı, yazılımı ve dosya sistemi ve protokol işlemleri hakkında ayrıntılı bilgi sağlar. InsightIQ, verileri herhangi bir performans aykırı değerini vurgulayan görsel bilgilere dönüştürerek darboğazların hızlı bir şekilde tanılanmasını veya iş akışlarının optimize edilmesini sağlar.
InsightIQ kullanımıyla ilgili ayrıntılar için PowerScale InsightIQ - Bilgi Merkezi'ne bakın.
InsightIQ olmadan sorun giderme
InsightIQ kullanmıyorsanız performans sorunlarını araştırmak için çeşitli komutlar çalıştırabilirsiniz. Önce ağ ve küme verimini inceleyerek, ardından küme işlemeyi inceleyerek ve son olarak tek tek düğüm CPU oranlarını gözden geçirerek performans sorunlarını giderin.
Ağ üretilen iş
Aşağıdakiler gibi bir ağ test aracı kullanın: Iperf veya Iperf3 Ağınızdaki küme ve istemci bilgisayarların aktarım hızı özelliklerini belirlemek için.
Kullan -arak Iperfkümede ve istemcide aşağıdaki komutları çalıştırın. Bu komutlar, ağ bağlantısının gecikme sorunlarının olası bir nedeni olup olmadığını gösterecek kadar büyük bir aralığı tanımlar.
- Küme:
iperf -s -w 262144 - İstemci:
iperf -c <cluster IP> -w 262144
Kullanıcı arayüzü uygulamalarını başlatmak için Iperf3kümede ve istemcide aşağıdaki komutları çalıştırın. Bu komutlar, ağ bağlantısının gecikme sorunlarının olası bir nedeni olup olmadığını gösterecek kadar büyük bir aralığı tanımlar.
- Küme:
iperf3 -s -w 262144 İstemci:iperf3 -c <cluster IP> -w 262144
İstemci bağlantılarının dağıtımı
Bir düğüme ayrıcalık tanımadıklarından emin olmak için kümeye kaç tane Ağ Dosya Sistemi (NFS) ve Sunucu İleti Bloğu (SMB) istemcisinin bağlı olduğunu kontrol edin.
- Kümedeki herhangi bir düğüme bir SSH bağlantısı açın ve kümedeki herhangi bir düğüm üzerinde
rootHesabı. - Şunu çalıştırın:
isi statistics query current list --nodes=all --keys=node.clientstats.connected.nfs,node.clientstats.active.nfs -dNFS istemcilerini kontrol etme komutu.
Çıktı, düğüm başına bağlı istemci sayısını ve her düğümde bu istemcilerden kaç tanesinin etkin olduğunu gösterir. - Şunu çalıştırın:
isi statistics query current list --keys=node.clientstats.connected.smb,node.clientstats.active.smb1,node.clientstats.active.smb2 -n all -dSMB istemcilerini kontrol etme komutu.
Çıktı, düğüm başına bağlı istemci sayısını ve her düğümde bu istemcilerden kaç tanesinin etkin olduğunu gösterir.
Küme aktarım hızı
Bir dosyadan okuma ve dosyaya yazma için gereken süreyi ölçen yazma ve okuma testleri gerçekleştirerek küme aktarım hızını değerlendirin. Aşağıdaki gibi en az bir yazma testi ve bir okuma testi gerçekleştirin.
Bir test yazın.
- Kümedeki herhangi bir düğüme bir SSH bağlantısıaçın ve kümedeki herhangi bir düğüm üzerinde
rootHesabı. - Değiştir:
/ifsDizin:cd /ifs - Kümedeki komut satırı arabiriminden (CLI) veya bir UNIX ya da Linux istemci bilgisayarından kümeye yeni bir dosya yazmak için
ddkomutunu kullanın.
Aşağıdaki komutu çalıştırın:dd if=/dev/zero of=1GBfile bs=1024k count=1024
Bu komut 1 GB lik örnek bir dosya oluşturur ve diske yazmak için geçen süreyi bildirir. - Bu komutun çıktısından, tek akışlı iş akışlarında diske saniyede kaç MB yazılabileceğini tahmini olarak hesaplayın.
- Bir MAC istemciniz varsa ve daha fazla analiz yapmak istiyorsanız,
- Etkinlik izlemeyi başlatın.
- Şunu çalıştırın:
cat /dev/zero > /pathToFilekomutu, buradapathToFile, hedeflenen dosyanın dosya yoludur.
Bu komut, Isilon kümesindeki yazma işlemlerinin aktarım hızını ölçmeye yardımcı olur. (İlgiliddkomutunu çalıştırırsanız, sonuçlar tutarsız olabilir.) - Activity Monitor'ın Network sekmesinde komutun sonuçlarını izleyin.
Testi okuyun.
Okuma işlemlerinin aktarım hızını ölçerken yazma testi sırasında oluşturduğunuz dosya üzerinde okuma testleri yapmadığınızdan emin olun. Bu dosya önbelleğe alındığı için okuma testlerinizin sonuçları hatalı olacaktır. Bunun yerine, önbelleğe alınmamış bir dosyanın okuma işlemini test edin. Kümede 1 GB'den büyük bir dosya bulun ve okuma testinde bu dosyadan yararlanın.
- Kümedeki herhangi bir düğüme bir SSH bağlantısı açın ve kümedeki herhangi bir düğüm üzerinde
rootHesabı. - Kümedeki CLI'dan veya bir UNIX ya da Linux istemci bilgisayarından, kümedeki bir dosyayı okumak için
ddkomutunu kullanın.
Şunu çalıştırın:dd if=/pathToLargeFile of=/dev/null bs=1024kkomut neredepathToFile, hedeflenen dosyanın dosya yoludur.
Bu komut, hedeflenen dosyayı okur ve dosyayı okumak için geçen süreyi bildirir. - Bir MAC istemciniz varsa ve daha fazla analiz yapmak istiyorsanız,
- Etkinlik izlemeyi başlatın.
- Şunu çalıştırın:
time cp /pathToLargeFile > /dev/nullkomut neredepathToFile, hedeflenen dosyanın dosya yoludur.
Bu komut, Isilon kümesindeki okuma işlemlerinin aktarım hızını ölçmeye yardımcı olur. (İlgiliddkomutunu çalıştırırsanız, sonuçlar tutarsız olabilir.) - Activity Monitor'ın Network sekmesinde komutun sonuçlarını izleyin.
Küme işleme
Yeniden şeritleme işleri.
Kümenin giriş/çıkış (G/Ç) işlemlerini (IOPS) incelemeden önce:
- Kümede hangi işlerin çalıştığını belirleyin. Auto-Balance, Collect veya MultiScan gibi yeniden şeritleme işleri çalışıyorsa bu işlerin neden çalıştığını ve çalışmaya devam etmeleri gerekip gerekmediğini göz önünde bulundurun.
- Tüketilmekte olan veri türünü göz önünde bulundurun. İstemci bilgisayarlar büyük video dosyalarıyla veya sanal makinelerle (VM'ler) çalışıyorsa yeniden şeritleme işi normalden daha yüksek miktarda disk IOPS gerektirir.
- Yeniden şeritleme işini geçici olarak duraklatabilirsiniz. Bu duraklatma, performansı artırabilir ve bir performans sorununa ilişkin kısa vadeli bir çözüm olabilir.
Disk G/Ç
Disk G/Ç'sini incelemek, belirli disklerin aşırı kullanılıp kullanılmadığını belirlemeye yardımcı olabilir.
Kümeye göre
- Kümedeki herhangi bir düğümde SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
- Şunu çalıştırın:
isi statistics pstatdisk G/Ç'sini belirleme komutu. Bu komutun çıktısından, disk IOPS'sini kümedeki toplam disk sayısına bölün. Örneğin, düğüm başına 12 sürücü barındıran Isilon IQ 12000x düğümlerini kullanan 8 düğümlü bir küme için disk IOPS'sini 96'ya bölersiniz.
X Serisi düğümler ve NL Serisi düğümlerinde, %100 rastgele iş akışları için 70 veya daha düşük disk IOPS'si ya da %100 sıralı iş akışları için 140 veya daha az disk IOPS'si görmeyi beklemeniz gerekir. NL Serisi düğümler, X Serisi düğümlerden daha az RAM'e ve daha düşük CPU hızlarına sahip olduğundan X Serisi düğümler daha yüksek disk IOPS'lerini işleyebilir.
Düğüme göre ve diske göre
- Kümedeki herhangi bir düğümde SSH bağlantısı açın ve "kök" hesabını kullanarak oturum açın.
- Şunu çalıştırın:
isi statistics query current --nodes=all --stats=node.disk.xfers.rate.sum --format=topDisk IOPS'sini düğüme göre belirleme komutu, aşırı kullanılan diskleri keşfetmeye yardımcı olabilir. - Şunu çalıştırın:
isi_stats_tool -a get_key_info|grep node.disk.xferDisk bazında istatistiklerin nasıl sorgulanacağını belirleme komutu.
Sıraya alınan işlemler
Disklerin aşırı kullanılıp kullanılmadığını belirlemenin başka bir yolu, kümedeki her disk için kaç işlemin kuyruğa alındığını tespit etmektir. Tek akışlı SMB tabanlı bir iş akışı için dörtlü bir sıra sorun olduğuna işaret edebilir ancak yüksek eş zamanlılık NFS ad alanı işlemleri için sıra daha uzundur.
- Kümedeki herhangi bir düğüme bir SSH bağlantısı açın ve kümedeki herhangi bir düğüm üzerinde
rootHesabı. - Şunu çalıştırın:
isi statistics drive list --nodes=all --sort=queued -dKümedeki her disk için kaç işlemin kuyruğa alındığını belirleme komutu. - İşlemin kuyrukta ne kadar kaldığını belirleyin:
isi statistics drive list --nodes=all --sort=queued -d
CPU
CPU sorunları genellikle istemcilerin kümede gerçekleştirdiği işlemlere kadar izlenir. İlgili isi statistics komutunu kullanıyorsanız, ağ protokolü veya istemci bilgisayar tarafından kataloglanan kümede gerçekleştirilen işlemleri belirleyebilirsiniz.
- Kümedeki herhangi bir düğüme bir SSH bağlantısı açın ve kümedeki herhangi bir düğüm üzerinde
rootHesabı. - Şunu çalıştırın:
isi statistics protocol list --long --totalby Op,proto -d --sort TimeAvg --format topAğ genelinde hangi işlemlerin gerçekleştirildiğini belirleme ve bu işlemlerden hangilerinin en çok zaman aldığını değerlendirme komutu.
Bu komut çıktısı, kümenin istemcilere yanıt vermesinin ne kadar sürdüğüne bağlı olarak düzenlenmiş olarak tüm ağ protokolleri için ayrıntılı istatistikler sağlar. Bu komutun sonuçları hangi işlemin en yavaş olduğunu belirleyemese de size doğru yöntemi gösterebilir. - Şunu çalıştırın:
isi statistics system --nodes all --format topkomutu, hangi düğümlerin CPU'larının en yoğun şekilde kullanıldığı gibi CPU işleme hakkında daha fazla bilgi edinmek için kullanılır. - Şunu çalıştırın:
isi_for_array -sX 'top -u -n |grep PID -A4'Her düğümde en fazla CPU kaynağını tüketen dört işlemi elde etme komutu.
Additional Information
Bu konuyla ilgili ilginizi çekebilecek önerilen kaynaklar şunlardır: