Configuratie van 64 compute-knooppunten van Dell EMC Ready oplossingen voor HPC Life Sciences kan 194 genoom per dag verwerken (50x diepte van dekking).
Overzicht
Variant van bellen is een proces waarmee we varianten van volgdata identificeren. Dit proces helpt bij het bepalen of er enkele oviotide polymorfismen (SNP's), invoegingen en verwijderingen (indels) en of structuurvarianten (SV's) op een bepaalde positie in een individueel genoom of exemptom zijn. Het belangrijkste doel van het identificeren van genoomvariaties is het koppelen aan menselijke ziekten. Hoewel niet alle menselijke ziekten worden geassocieerd met variaties in variaties, kan het oproepen van varianten een waardevolle richtlijn bieden voor organisaties die werken aan een bepaalde ziekte die wordt veroorzaakt door variaties in het ziektebeeld. BWA-GATK is een van de next-generation Sequencing (NGS) rekentools die zijn ontworpen om ziektekiem- en somatische ziektekiemen te identificeren uit menselijke NGS-data. Er zijn een handvol verschillende identificatietools en we begrijpen dat er niet één tool is die perfect presteert (1). We kozen echter voor GATK, een van de populairste tools als onze benchmarktool om aan te tonen hoe goed de Dell EMC Ready oplossingen voor HPC Life Sciences complexe en enorme NGS-workloads kunnen verwerken.
Het doel van deze blog is om waardevolle prestatie-informatie te verstrekken over de Intel® Xeon® Gold 6248 processor voor BWA-GATK pipeline benchmark met Dell EMC Ready Solutions voor HPC Lustre Storage (me4 serie refresh) (2). De Xeon® Gold 6248 CPU beschikt over 20 fysieke cores of 40 logische cores bij gebruik van hyper threading. De testclusterconfiguraties zijn samengevat in Tabel 1.
Dell EMC PowerEdge C6420 | |
---|---|
CPU | 2 x Xeon® Gold 6248 20 cores 2,5 GHz (Cascade Lake) |
RAM | 12 x 16 GB bij 2933 MTp's |
BESTURINGSSYSTEEM | RHEL 7.6 |
Interconnect | Intel® Omni-Path |
BIOS-systeemprofiel | Prestaties geoptimaliseerd |
Logische processor | Disabled |
Virtualisatietechnologie | Disabled |
BWA | 0,7,15-r1140 |
Samtools | 1.6 |
GATK | 3,6-0-g89b7209 |
Dell EMC Ready oplossing voor Lustre Storage | |
---|---|
Aantal knooppunten | 1x Dell EMC PowerEdge R640 als Integrated Manager voor Lustre (IML) 2x Dell EMC PowerEdge R740 als metadataserver (MDS) 2x Dell EMC PowerEdge R740 als Object Storage Server (OSS) |
Processoren | IML-server: Dual Intel Xeon Gold 5118 bij 2,3 GHz MDS- en OSS-servers: Dubbele Intel Xeon Gold 6136 bij 3,00 GHz |
Geheugen | IML-server: 12 x 8 GB 2666 MT/s DDR4 RDIMM's MDS- en OSS-servers: 24 x 16 GiB 2666 MT/s DDR4 RDIMM's |
Externe storagecontrollers |
2 x Dell 12 Gb/s SAS HBA's (op elke MDS) 4 x Dell 12 Gb/s SAS HBA's (op elke OSS) |
Behuizingen voor objectstorage |
4x ME4084 met in totaal 336 x 8 TB NL 7200 rpm SAS HDD's |
Metadata storagebehuizing |
1x ME4024 met 24 x 960 GB SAS SSD's. Ondersteunt tot 4,68 B inodes |
RAID-controllers | Duplex SAS RAID-controllers in de ME4084- en ME4024-behuizingen |
Besturingssysteem | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
BIOS-versie | 1.4.5 |
Intel Omni-Path IFS-versie |
10.8.0.0 |
Lustre-bestandssysteemversie |
2.10.4 |
IML-versie | 4.0.7.0 |