跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell EMC HPC NFS Depolama Çözümü - Yüksek Kullanılabilirlik (NSS7.4 - HA) Yapılandırması

摘要: Bu blogta, Intel'in "Cascade Lake" kod adlı ikinci nesil Xeon Ölçeklendirilebilir İşlemcilerini kullanan Dell EMC HPC NFS Depolama Çözümü sürüm 7.4 (NSS7.4-HA) açıklanmaktadır. ...

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

Makale, Dell EMC HPC ve AI Innovation Lab bünyesindeki Nirmala Sundararajan ve Mario Gallegos tarafından Haziran 2019'da yazılmıştır

原因

解决方案


Çözüme Genel Bakış

Bu blogta, Intel'in "Cascade Lake" kod adlı ikinci nesil Xeon Ölçeklendirilebilir İşlemcilerini kullanan Dell EMC HPC NFS Depolama Çözümü sürüm 7.4 (NSS7.4-HA) açıklanmaktadır.  Bu geliştirilmiş Xeon işlemcilerinde 28 adede kadar çekirdek, 38,5 MB'ye kadar son düzey önbelleği ve soket başına altı adet 2933 MT/sn bellek kanalı bulunur.  Cascade Lake iþlemcilerinin önemli özellikleri, yan kanal saldırılarına, ıNTEL DL Boost (vnnı) ve artan saat hızları ve bellek hızları için tümleşik donanım azaltıcı etkenlerdir .

Cascade Lake ve öncül ran (ftive d, RAM d, b.ve sonra da)adlı bir özellikiçerir. ADDDC, Single Device Data Correction (Tek Cihaz Veri Düzeltme) (SDDC) ve Hata düzeltme kodu (ECC) belleği sağlamaya devam ederken arızalı DRAM aygıtlarını dinamik bir şekilde ayrıntılarıyla göstermek için çalışma zamanında dağıtılır ve böylece DIMM kullanım ömrü artar. Bu özellik, yalnızca x4 DRAM aygıtları için etkinleştirilir ve sistemde x8 DRAM aygıtları varsa hiçbir şey yapmaz. En son NSS-HA sürümü 7.4, belleğin x8 düzeninde olan yalnızca 16 GB'sini kullanır. ADDDC BIOS'ta gri durumdadır ve ayarlanabilir bir seçenek değildir. Ancak, x4 bir 32 bellek kullanıyorsanız, ADDDC, tunable seçeneği olarak sunulur ve RAS özellikleri üzerinde performansı tercih etmek için Disabled (devre dışı) olarak ayarlanmalıdır.

NFS sunucularını, "Intel Cascade Lake işlemciler Için BIOS karakterleme" bölümünde AÇıKLANDıĞı gibi HPC profili ile yapılandırmanız önerilir. Bu, alt NUMA kümesi etkin, mantıksal işlemci devre dışı ve sistem profili "performans" olarak ayarlı olmak üzere BIOS 'u ayarlamayı içerir. Var olan bir sistemi yükseltiyorsanız CPU'ları Cascade Lake işlemcilerine yükseltmeden önce ilk olarak BIOS'un Cascade Lake CPU'larını destekleyen bir sürüme güncelleştirildiğinden emin olun. HPC ve AI Innovation Lab'deki HPC Mühendisleri ekibi, Cascade Lake işlemcilerinin takılı olduğu NSS sunucuları üzerinde bir dizi değerlendirme testi yaptı ve sonuçları, "Skylake-SP" Xeon ailesi işlemcilerinin bir önceki neslinin takılı olduğu PowerEdge sunucularının en son sürümünü kullanan NSS7.3-HA çözümünden (İngilizce) alınan sonuçlarla karşılaştırdı. Kıyaslama sonuçları ve karşılaştırma bu blogda sunulur.

Dell EMC tarafından verilen NFS depolama çözümü optimize edilmiştir ve en iyi performans için ayarlanmıştır.  NSS7.4-HA çözümü kurulurken aşağıdaki önemli noktalar göz önünde bulundurulmalıdır:
  1. Cascade Lake İşlemcilerinin kullanımını destekleyen minimum işletim sistemi Red Hat Enterprise Linux 7.6'dır. Ancak çekirdek sürümü 3.10.0-957.el7 ile NFS paylaşımı, kworker gibi bir görev ile takılı kalıp CPU'nun %100'ünü tüketir. Bu sorunun temel nedeni, TCP katmanının SunRPC katmanlarının taşıma durumu ile senkronizasyonunun bozulmasıdır. Bu sorun, kernel-3.10.0-957.5.1.el7 paketi veya sonraki bir sürümüyle çözülmüştür. Bu durumda bu çözüm için temel işletim sistemi olarak RHEL7.6 ve çekirdek sürümü olarak kernel-3.10.0-957.5.1.el7 kullanılır. Daha fazla bilgi için lütfen https://access.redhat.com/solutions/3742871 adresini ziyaret edin.
  2. NSS7.4-HA çözümünde, aşağıdaki paketler yüklenmediği sürece nfs-idmapd.service başlayamadığından dolayı nfsserver kaynağı da başlayamaz. Daha fazla bilgi için lütfen https://access.redhat.com/solutions/3746891 adresini ziyaret edin.
    • resource-agents-4.1.1-12.el7_6.4
    • resource-agents-aliyun-4.1.1-12.el7_6.4
    • resource-agents-gcp-4.1.1-12.el7_6.4 veya üzeri.
  3. RHEL7.6'nın sürüm notları, LVM'nin G/Ç katmanındaki bir hatanın, bir fiziksel birimin dağıtılabilir alanının ilk 128 KB'sinde veri bozulmasına neden olduğuna dikkat çekiyor.  Bu sorun, lvm2-2.02.180-10.el7_6.2 veya daha sonraki sürümlerle çözülmüştür.  Bu nedenle lvm2 paketinin en son sürüme güncelleştirildiğinden emin olun. lvm2'yi güncelleştirme gibi bir seçeneğiniz yoksa geçici çözüm, birim grubundaki (VG) mantıksal birimler kullanımdayken lvcreate (lvoluştur) veya lvextend (lvgenişlet) gibi VG meta verilerini değiştiren LVM komutlarını kullanmamaktır.



NSS7.4-HA Mimarisi

Şekil 1'de NSS7.4-HA'nın tasarımı gösterilmiştir. Gerekli yazılım ve bellenim güncelleştirmeleri haricinde NSS7.4-HA ve NSS7.3-HA, aynı HA kümesi yapılandırmasını ve depolama yapılandırmasını kullanır. Aktif-pasif yüksek kullanılabilirlik yapılandırmasındaki NFS sunucuları çifti, PowerVault ME4084'e takılır. Her bir NFS sunucusunda çift SAS kartı bulunur. Her kartın paylaşılmış depolamadaki her bir denetleyiciye bağlı SAS kablosu vardır; bu sayede tek bir SAS kartının veya SAS kablosunun arızalanması veri kullanılabilirliğini etkilemez. [Yapılandırma hakkında daha ayrıntılı bilgi almak için NSS7.3-HA teknik raporu (İngilizce) belgesine başvurun]. NSS7.4-HA Mimarisi
SLN317325_en_US__1001
 

 

NSS7.4-HA ve NSS7.3-HA bileşenlerinin karşılaştırılması

İlk NSS-HA sürümünden beri Dell NSS-HA çözümlerinin daha yüksek kullanılabilirlik, daha yüksek performans ve daha geniş depolama kapasitesi sunması için birçok donanım ve yazılım yükseltmesi yayınlanmış olsa da NSS-HA çözüm ailesinin mimari tasarımı ve dağıtım esasları değişmemiştir. En yeni sürüm ve önceki sürüm olan NSS7.3-HA aynı depolama arka ucunu (Power Vault ME4084) kullanmaktadır. Aşağıdaki tablo, en yeni NSS7.4-HA çözümü ve önceki NSS7.3-HA çözümünde kullanılan bileşenlere yönelik bir karşılaştırma sağlar

 
Tablo 1: Tablo 1: NSS7.4-HA ve NSS7.3-HA bileşenlerinin karşılaştırılması 
Çözüm NSS7.4-HA Sürümü (Haziran 2019) NSS7.3-HA Sürümü (Ekim 2018)
NFS Sunucu Modeli 2x Dell EMC PowerEdge R740
Dahili Bağlantı Dell Networking S3048-ON kullanan Gigabit Ethernet
Depolama Alt Sistemi Dell EMC PowerVault ME4084
84-3,5 "NL SAS sürücüler, 12 TB 'ye kadar.
En fazla 100 8 TB (ham alan)
8 LUN, doğrusal 8 + 2 RAID 6, öbek boyutu 128Kıb 'yi destekler.
4 Genel HDD yedeği.
Depolama Bağlantısı 12 GB/sn SAS bağlantıları.
İşlemci 2,6 GHz'de 2x Intel Xeon Gold 6240, işlemci başına 18 çekirdek 3.0 GHz'de 2x Intel Xeon Gold 6136, işlemci başına 12 çekirdek
Bellek 12 x 16 GiB 2933 MT/sn RDIMM'ler 12 x 16 GiB 2666 MT/sn RDIMM'ler
İşletim Sistemi Red Hat Enterprise Linux 7.6 Red Hat Enterprise Linux 7.5
Kernel sürümü 3.10.0-957.5.1.el7.x86_64 3.10.0-862.el7.x86_64
Red Hat Ölçeklenebilir Dosya Sistemi (XFS) v4.5.0-18 v4.5.0-15
Harici Ağ Bağlantısı Mellanox ConnectX-5 InfiniBand EDR/100 GbE ve 10 GbE Mellanox ConnectX-5 InfiniBand EDR ve 10 GbE.
NSS 7.3-ha çözüm bloguiçin, Mellanox ConnectX-4 ıB EDR/100 GbE için kullanılmıştır.
OFED Sürümü Mellanox OFED 4.5-1.0.1.0 Mellanox OFED 4.4-1.0.0


Blogun geri kalanında, NSS7.4-HA'nın sınama ortamı ve G/Ç performans bilgileri verilecektir. NSS7.4-HA ve önceki sürüm arasındaki performans farkını göstermek için NSS7.3-HA'nın ilgili performans değerleri de verilmiştir.

 



Sınama Ortamı Yapılandırması

NSS7.4-HA çözümünün performansını ve işlevselliğini değerlendirmek için kullanılan sınama ortamı burada açıklanmıştır. Xeon Gold 6240 CPU'ları, bu çalışma için zamanında alınamadığından performans testi için kullanılan CPU'ların, söz konusu çözüm için seçilenlerden farklı olduğunu göz önünde bulundurun. 6240 işlemcileri mevcut olduğunda testin bir kısmının tekrarlanması ve bu raporun gerektiği şekilde değiştirilmesi planlanmaktadır.
 
Tablo 2: NSS 7.4-HA donanım yapılandırması 
Sunucu Yapılandırması
NFS Sunucu Modeli Dell PowerEdge R740
İşlemci 3,60 GHz'de 2x Intel Xeon Gold 6244 CPU, her birinde 8 çekirdek
Bellek 12 x 16 GiB 2933 MT/sn RDIMM'ler
Yerel diskler ve RAID Denetleyicisi Beş adet 300 GB 15K SAS sabit sürücüleri ile PERC H730P. İşletim sistemi için RAID1'de iki sürücü yapılandırılır, değiştirme alanı için RAID0'da iki sürücü yapılandırılır ve beşinci sürücü ise RAID1 disk grubu için bir dinamik yedektir.
Mellanox EDR kartı (yuva 8) Mellanox ConnectX-5 EDR kartı
1 GbE Ethernet kartı (Yardımcı kart yuvası) Broadcom 5720 QP 1 Gigabit Ethernet ağ yardımcı kartı. Ya da Intel(R) Gigabit 4P I350-t rNDC
Harici depolama denetleyicisi (yuva 1 ve yuva 2) İki Dell 12 Gb/sn SAS HBA
Sistem Yönetimi iDRAC9 Enterprise
Depolama Yapılandırması
Depolama Muhafazası 1x Dell PowerVault ME4084 muhafazası
RAID denetleyicileri Dell ME4084'te çift yönlü RAID denetleyicileri
Sabit Disk Sürücüleri 84 - dizi başına 10 TB 7.2K NL SAS sürücüleri, toplamda 84 x 10 TB disk
Diğer Bileşenler
Özel Gigabit Ethernet anahtarı Dell Networking S3048-ON
Güç Dağıtım Birimi İki APC anahtarlı Raf tipi Güç Dağıtım Birimi, AP7921B modeli


Tablo 3: NSS 7.4-HA sunucu yazılımı sürümleri 
Bileşen Açıklama
İşletim Sistemi Red Hat Enterprise Linux (RHEL) 7.6 x86_64 errata
Kernel sürümü 3.10.0-957.5.1.el7.x86_64
Küme Paketi RHEL 7.6'dan Red Hat Küme Paketi
Filesystem Red Hat Ölçeklenebilir Dosya Sistemi (XFS) 4.5.0-18.
Sistem Yönetimi aracı Dell OpenManage Server Administrator 9.3.0-3407_A00
  

Tablo 4: NSS 7.4-HA Istemci yapılandırması 
Bileşen Açıklama
Sunucular (İngilizce) 32x Dell EMC PowerEdge C6420 Bilgi İşlem Düğümü
CPU 2,40 GHz'de 2x Intel Xeon Gold 6148 CPU, işlemci başına 20 çekirdek
Bellek 12 x 16 GiB 2666 MT/sn RDIMM'ler
İşletim Sistemi Red Hat Enterprise Linux Sunucusu sürüm 7.6
Kernel Sürümü 3.10.0-957.el7.x86_64
 Interconnect Mellanox InfiniBand EDR
OFED sürümü 4.3-1.0.1.0
ConnectX-4 bellenimi 12.17.2052
 


NSS7.4-HA G/Ç performans özeti

Bu bölümde, mevcut NSS7.4 çözümü için G/Ç performans testlerinin sonuçları verilmiştir. Çözümün maksimum kapasitesini ölçmek için tüm performans testleri, arızasız bir senaryoda gerçekleştirilmiştir. Testlerde üç G/Ç modeli tipi üzerinde yoğunlaşılmıştır: büyük sıralı okumalar ve yazmalar, küçük rastgele okumalar ve yazmalar ve üç meta veri işlemi (dosya oluşturma, istatistik ve kaldırma). Önceki sürüm NSS 7.3-HA gibi, çözüm son tarih ı/O Zamanlayıcısı ve 256 NFS daemons 'ı kullanır.

8 40TB (ham depolama boyutu) yapılandırması, EDR üzerinden ıpoıb ağ bağlantısıyla işaretlenmişti. Değerlendirme testleri için iş yükü oluşturmak üzere 32 düğümlü bir bilgi işlem kümesi kullanıldı. Her bir test, çözümün ölçeklenebilirliğini test etmek için bir dizi istemci üzerinden çalıştırıldı.

Bu çalışma sırasında ıozone ve mdtest kıyaslamaları kullanılmıştır. IOzone, sıralı ve rastgele testler için kullanıldı. Sıralı testler için 1024 KiB istek boyutu kullanıldı. NFS sunucu önbelleğinin doygun olduğundan emin olmak için toplam 2 TB veri aktarımı yapıldı. Rastgele testlerde 4 KiB istek boyutu kullanıldı ve her istemci, 4 GiB boyutunda bir dosyayı okuyup yazdı. Meta veri testleri, OpenMPI ile birlikte mdtest değerlendirme testi kullanılarak ve dosya oluşturma, istatistik ve kaldırma işlemleri ile gerçekleştirildi. [Testlerde kullanılan komutların tümünü görmek için NSS7.3-HA teknik raporundaki (İngilizce) Ek A'ya başvurun.]

 

IPoIB sıralı okuma ve yazmaları N-N

Sıralı okuma ve yazmaları değerlendirmek için sıralı okuma ve yazma modunda IOzone değerlendirme testi sürüm 3.487 kullanıldı. Bu testler, 1 iş parçacığından başlayıp ikiye katlanarak 64 iş parçacığına kadar olmak üzere çeşitli iş parçacığı sayılarıyla gerçekleştirildi. Bu test iş parçacığı başına bir dosya veya N-N senaryosunda çalıştığı için her iş parçacığı sayısında eşit sayıda dosya oluşturuldu. Belirli bir test dahilindeki iş parçacığı sayısı arasında eşit olarak bölünen bir toplam dosya boyutu seçilmiştir.

Şekil 2 NSS 7.3-HA sürümü ile NSS 7.4-HA sürümünün sıralı g/ç performansı ile kıyaslanmasını sağlar. Şekilden görülebileceği gibi, 7 GB/sn en yüksek okuma performansı ve 5 GB/sn en yüksek yazma performansı ile en son sürüm NSS7.4 ve önceki sürüm NSS7.3'ün en yüksek performansı birbirine yakındır. Ancak bazı iş parçacığı sayılarında, NSS7.3-HA çözümü ile karşılaştırıldığında yazma performansında %15-20 düşüş ölçülmüştür. Bu performans farklılığının nedeni araştırılmaktadır. 1 ve 2 iş parçacığında okuma performansında neredeyse %45 artış görülürken 8 iş parçacığında %18 artış görüldü. 8'den daha fazla sayıda iş parçacığında okuma performansı NSS7.3-HA çözümünün performansıyla benzerdir. Düşük iş parçacığı sayısındaki okuma performansı artışı, büyük ihtimalle Cascade Lake işlemcilerinde yan kanal saldırılarına karşı uygulanan donanım riski azaltma yöntemlerinden kaynaklanmaktadır. IPoIB büyük sıralı G/Ç performansı

SLN317325_en_US__2image002 (3)


 

IPoIB rastgele okuma ve yazmaları N-N

Rastgele G/Ç performansını değerlendirmek için rastgele modunda IOzone 3.487 sürümü kullanıldı. Testler, 1'den başlayıp ikiye katlanarak 64 iş parçacığına kadar olmak üzere çeşitli iş parçacığı sayılarıyla gerçekleştirildi. Kayıt boyutu olarak 4 KB seçildi. Her istemci, küçük rastgele veri erişimlerini simüle etmek için 4 GiB dosya okudu veya yazdı.  Küme yalnızca 32 düğümüne sahip olduğundan, 64-iş parçacığı veri noktası her biri 2 iş parçacığı çalıştıran 32 istemcilerle birlikte elde edildi.

Şekil 3 NSS 7.3-HA ' n I n ile NSS 7.4-HA ' n I n rastgele yazma ve okuma g/ç performansının karşılaştırmasını göstermektedir. Şekilden gözlendiği üzere NSS7.4-HA'nın en yüksek rastgele yazma performansı, NSS7.3-HA performansına yakındır (7300 IOPS civarı).  NSS7.4-HA çözümünde, düşük sayıda iş parçacığı (1 ve 2) için yazma performansı çözümün önceki sürümüyle karşılaştırıldığında yaklaşık %14 daha düşüktür. Bu durumun nedeni araştırılmaktadır.  Rastgele okuma performansı, NSS7.4'te istikrarlı olarak artar ve 64 iş parçacığında 16.607 IOPS olan en yüksek performans noktasına ulaşır. Bir önceki sürümde (NSS7.3-HA) en yüksek performans, 32 iş parçacığında 28.811 IOPS olarak ölçülmüştür. Bu değer, NSS7.4-HA çözümünde rastgele okumalar için elde edilen en yüksek performans değerinden %42 daha fazladır. IPoIB rastgele G/Ç performansı

SLN317325_en_US__303 (1)

 

IPoIB meta veri işlemleri

Sistemin meta veri performansını değerlendirmek için MDTest aracının 1.9.3 sürümü kullanıldı. MPI dağıtımı olarak OpenMPI 1.10.7 sürümü kullanıldı.  Tablo 5'te gösterildiği gibi çözümün ölçeklenebilirliğini test etmek adına meta veri testleri, 32 adede kadar iş parçacığı için 960.000 dosya oluşturulup ardından dosyaların sayısı artırılarak gerçekleştirildi. Meta veri testleri: İş parçacıkları arasında dosya ve dizinlerin dağıtılması 
İş Parçacığı sayısı Dizin başına Dosya sayısı İş parçacığı başına Dizin sayısı Toplam dosya sayısı
1 3000 320 960.000
2 3000 160 960.000
4 3000 80 960.000
8 3000 40 960.000
16 3000 20 960.000
32 3000 10 960.000
64 3000 8 1.536.000
128 3000 4 1.436.000
256 3000 4 3.072.000
512 3000 4 6.144.000


Şekil 4, Şekil 5 ve Şekil 6, sırasıyla dosya oluşturma, istatistik ve kaldırma işlemlerinin sonuçlarını gösterir. HPC bilgi işlem kümesinde 32 bilgi işlem düğümü olduğundan, aşağıdaki grafiklerde her bir istemcide 32 adede kadar olan iş parçacıkları için düğüm başına maksimum bir iş parçacığı yürütülmüştür. 64, 128, 256 ve 512 istemci sayıları için her bir düğümde 2, 4, 8 veya 16 eşzamanlı işlem yürütülmüştür.
Dosya oluşturma işlemlerinde, 16 iş parçacığına kadar performansta %20 artış söz konusudur ancak 32 veya daha fazla iş parçacığında iki sürümün performansı birbirine çok yakındır. 
NSS 7.4 'deki istatistik işlemleri, daha düşük iş parçacığı sayımlarında (1, 2, 8 ve 16) performans açısından %10 ' a kaydoldu ve daha yüksek iş parçacığı sayımlarında %30 ' a > (64 iş parçacıklarından 512 iş parçacıklarına kadar).
Son olarak, kaldırma işlemlerinde 64 istemciye kadar performansta %14 düşüş > ve 128.256 ve 512 daha yüksek iş parçacığı sayısı için %20 düşüş vardı.

 
Şekil 4: Ipoıb dosyası performans
SLN317325_en_US__404 (1)

Oluştur
Şekil 5: Ipoıb performans
SLN317325_en_US__505 (1)
istatistikleri

Şekil 6: Ipoıb dosyasında çıkarma performansı
SLN317325_en_US__606 (1)


 

Sonuç

Aşağıdaki tablo, çözümün yeni sürümü NSS7.4 ve önceki sürümü NSS7.3 arasında gözlemlenen performans farkını özetlemektedir.  Tablo 5: NSS7.4 ve NSS7.3 HA sürümlerinin performans karşılaştırması
Dell EMC HPC NFS Depolama NSS7.4-HA NSS7.4 – HA NSS7.3-HA
Sıralı 1MB yazar en yüksek: % 1,4 düşüş 4834 MB/sn 4906 MB/sn
Sıralı 1MB okuma en yüksek: % 0,7 düşüş 7024 MB/sn 7073 MB/sn
En yüksek rasgele 4 KB Yazar: % 0,7 düşüş 7290 IOps 7341 IOps
Rastgele 4 KB en yüksek okuma: %42 düşüş 16.607 IOps 28.811 IOps
Operasyon oluştur/ikinci tepe: % 1,1 düşüş 54.197 Op/sn 54.795 Op/sn
İstatistik işlemleri/ikinci tepe: %35 düşüş 522.231 Op/sn 808.317 Op/sn
Operasyonları kaldır/ikinci tepe: %35 düşüş 47.345 Op/sn 73.320 Op/sn


Yukarıdaki sonuçlardan mevcut NSS7.4-HA çözümünün, önceki sürüm olan NSS7.3-HA çözümüyle benzer bir performans sergilediğini görebiliriz. Rastgele okumalardaki ve yüksek iş parçacığı sayılarında dosya istatistiği ve dosya kaldırma işlemlerindeki performans düşüşünün, NSS7.4-HA çözümünün performans değerlendirme testlerinde kullanılan Xeon Gold 6244 CPU'larda daha az sayıda çekirdek bulunmasıyla ilgili olup olmadığını anlamak için işlemci başına 18 çekirdeği olan Xeon Gold 6240 CPU'larla değerlendirme testlerini gerçekleştirmeyi planlıyoruz.



Referanslar

NSS-HA çözümleriyle ilgili ayrıntılı bilgi için lütfen yayınladığımız teknik raporlara başvurun

 

文章属性


受影响的产品

High Performance Computing Solution Resources

上次发布日期

28 2月 2021

版本

4

文章类型

Solution