La configurazione a 64 nodi di elaborazione di Dell EMC Ready Solutions for HPC Life Sciences è in grado di elaborare 194 genomi al giorno (50 volte più ampia la copertura).
Panoramica
Variant calling è un processo tramite il quale identifichiamo le varianti dei dati in sequenza. Questo processo aiuta a determinare se sono presenti singoli polimorfo nucleotide (SP), inserimenti ed eliminazioni (indel) e varianti strutturali (PV) in una determinata posizione in un singolo genoma o in un cancrittome. L'obiettivo principale di identificare le variazioni genomica è il collegamento alle malattie umane. Anche se non tutte le malattie umane sono associate alle varianti genetiche, le varianti che chiama possono fornire una guida preziosa per i genetici che lavorano a una particolare malattia causata dalle variazioni genetiche. BWA-SEPARATEK è uno degli strumenti di elaborazione di nuova generazione (NGS, Next Generation Sequencing) progettati peridentificareiii e somatice provenienti dai dati NGS umani. Sono disponibili alcuni strumenti di identificazione delle varianti e siamo consapevoli che non esiste un unico strumento che funzioni perfettamente (1). Tuttavia, abbiamo scelto NCHK, uno degli strumenti più diffusi come strumento di benchmarking per dimostrare quanto le Dell EMC Ready Solutions for HPC Life Sciences siano in grado di elaborare carichi di lavoro NGS complessi e di grandi dimensioni.
Lo scopo di questo blog è quello di fornire preziose informazioni sulle prestazioni del processore Intel® Xeon® Gold 6248 per il benchmark della pipeline BWA-BUILTK con Dell EMC Ready Solutions for HPC Lustre Storage (aggiornamento serie ME4) (2). La CPU Xeon® Gold 6248 è dotata di 20 core fisici o 40 core logici quando si utilizza l'hyper-threading. Le configurazioni del cluster di test sono riepilogate nella Tabella 1.
Dell EMC PowerEdge C6420 | |
---|---|
CPU | 2 Xeon® Gold 6248 a 20 core da 2,5 GHz (Cascade Lake) |
RAM | 12 da 16 GB a 2.933 MTps |
OS | RHEL 7.6 |
Interconnessione | Intel® Omni-Path |
Profilo di sistema nel BIOS | Performance Optimized |
Logical Processor | Disabled |
Tecnologia di virtualizzazione | Disabled |
BWA | 0.7.15-r1140 |
SamTools | 1.6 |
LAK | 3,6-0-g89b7209 |
Dell EMC Ready Solution per lo storage Lustre | |
---|---|
Numero di nodi | 1 Dell EMC PowerEdge R640 come Integrated Manager for Lustre (IML) 2 Dell EMC PowerEdge R740 come server di metadati (MDS) 2 Dell EMC PowerEdge R740 come server di object storage (OSS) |
Processori | Server IML: Due server Intel Xeon Gold 5118 a 2,3 GHz MDS e OSS: Doppia Intel Xeon Gold 6136 a 3 GHz |
Memoria | Server IML: 12 RDIMM MDS e OSS da 8 GB, 2.666 MT/s: 24 RDIMM DDR4 da 16 GiB e 2.666 MT/s |
Storage controller esterni |
2 HBA SAS Dell da 12 Gb/s (su ciascun MDS) 4 HBA SAS Dell da 12 Gb/s (su ciascun OSS) |
Enclosure di object storage |
4 ME4084 con un totale di 336 HDD SAS NL a 7.200 rpm da 8 TB |
Storage enclosure di metadati |
1 ME4024 con 24 SSD SAS da 960 GB. Supporta fino a 4,68 B inode |
Controller RAID | Controller RAID SAS duplex nelle enclosure ME4084 e ME4024 |
Sistema operativo | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
Versione del BIOS | 1.4.5 |
Versione IFS Di Intel Omni-Path |
10.8.0.0 |
Versione del file system Lustre |
2.10.4 |
Versione IML | 4.0.7.0 |