HPC Yaşam Bilimleri için Dell EMC Ready Çözümlerinin 64 bilgi işlem düğümü yapılandırması, günde 194 genom işleyin (50x kapsam derinliği).
Genel Bakış
Değişken arama sıra verilerine göre değişkenlerini tanımlayan bir süreçtir. Bu işlem, tek bir genom veya dekstride belirli bir konumda tek nükleotid poli morfin (SNP'ler), eklemeler ve silmeler (indel'ler) ve yapısal varyantlar (SVs) olup olmadığını belirlemeye yardımcı olur. Genom varyasyonlarını belirlemenin ana amacı, insanla bağlantı oluşturmaktır. Her insan hatasını, değişken arama, çeşit çeşitlemelerle ilişkilendirilmese de değişken arama, çeşitlemelerden kaynaklanan belirli bir yanlışlık üzerinde çalışan, varlıklı müşteriler için değerli bir kılavuz sağlar. BWA-GATK, insan NGS verilerinden germline ve somatik sapmaları tanımlamak için tasarlanmış Yeni Nesil Sıralama (NGS) hesaplama araçlarından biri. Çeşitli değişken tanımlama araçları vardır ve mükemmel performans sergileyen tek bir araç olmadığını anlarız (1). Ancak HPC Yaşam Bilimleri için Dell EMC Ready Çözümlerinin karmaşık ve devasa NGS iş yüklerini ne kadar iyi işleyecği olduğunu göstermek için karşılaştırma aracımız olarak en popüler araçlardan biri olan GATK'yi seçtik.
Bu blogun amacı, HPC Lustre Depolaması (ME4 serisi yenileme) için Dell EMC Ready Solutions ile BWA-GATK hattı karşılaştırmalı testi için Intel® Xeon® Gold 6248 işlemci hakkında değerli performans bilgileri sağlamaktır (2). Xeon® Gold 6248 CPU, hiper iş parçacığı kullanırken 20 fiziksel çekirdeğe veya 40 mantıksal çekirdeğe sahiptir. Test kümesi yapılandırmaları Tablo 1'de özetlenmiştir.
Dell EMC PowerEdge C6420 | |
---|---|
CPU | 2x Xeon® Gold 6248 20 çekirdek 2,5 GHz (Cascade Lake) |
RAM | 2933 MTp'de 12x 16 GB |
İşletim Sistemi | RHEL 7.6 |
Interconnect | Intel Omni-Path (Intel® Omni-Path) |
BIOS Sistem Profili | Optimize Edilmiş Performans |
Mantıksal İşlemci | Disabled |
Sanallaştırma Teknolojisi | Disabled |
BWA | 0.7.15-r1140 |
Samtool'lar | 1.6 |
GATK | 3,6-0-g89b7209 |
Lustre Depolaması için Dell EMC Ready Çözümü | |
---|---|
Düğüm sayısı | 1x Dell EMC PowerEdge R640, Nesne Depolama Sunucusu (OSS) olarak Metadata Server (MDS) 2x Dell EMC PowerEdge R740 olarak Lustre (IML) 2x Dell EMC PowerEdge R740 için Integrated Manager olarak |
İşlemciler | IML sunucusu: 2,3 GHz MDS ve işletim sistemi sunucularında çift Intel Xeon Gold 5118: 3,00 GHz'de Çift Intel Xeon Gold 6136 |
Bellek | IML sunucusu: 12 x 8 GB 2.666 MT/sn DDR4 RDIMM MDS ve OSS sunucuları: 24 x 16 GiB 2.666 MT/s DDR4 RDIMM |
Harici depolama denetleyicileri |
2 x Dell 12 Gb/sn SAS HBA'lar (her MDS'de) 4 x Dell 12 Gb/sn SAS HBA'lar (her bir işletim sisteminde) |
Nesne depolama muhafazaları |
Toplam 336 x 8 TB NL 7,2K rpm SAS HDD'ler ile 4x ME4084 |
Meta veri depolama muhafazası |
24x 960 GB SAS SSD ile 1x ME4024. 4,68 B'ye kadar inod'ları destekler |
RAID denetleyicileri | ME4084 ve ME4024 muhafazalarda çift yönlü SAS RAID denetleyicileri |
İşletim sistemi | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
BIOS sürümü | 1.4.5 |
Intel Omni-Path IFS sürümü |
10.8.0.0 |
Lustre dosya sistemi sürümü |
2.10.4 |
IML sürümü | 4.0.7.0 |