Dell EMC Ready Solutions for HPC -biotieteiden 64 tietojenkäsittelyn solmukokoonpano voi käsitellä 194 genomia päivässä (50-kertainen kattavuussyvyys).
Yleiskuvaus
Versiopuhelut on prosessi, jossa eriytetään versioita järjestystiedoista. Tämän prosessin avulla voit määrittää, onko yksittäisen osioinnin polymorfismeja (SNP), asennuksia ja poistoja (indels) ja tai rakenneversioita (SV) samassa asennossa yksittäisessä genomessa tai genomissa. Genomivaihtelujen pääasiallinen tavoite on yhdistää ihmisen ilmenemistekijät. Vaikka kaikki ihmisen ilmeneminen ei liity olemassa oleviin muunnelmiin, varianttien kutsuminen voi olla hyödyllinen ohje, joka koskee keltaisten muunnoksen aiheuttamia oireita. BWA-GATK on yksi seuraavan sukupolven sekvensointityökaluista (NGS), jotka on suunniteltu tunnistamaan ihmisen NGS-tiedoista peräisin olevia komentorivi- ja somaattisia mutaatioita. Versioiden tunnistustyökaluja on runsaasti, ja ymmärrämme, että kaikki työkalut eivät toimi täydellisesti (1). Olemme kuitenkin valinneet vertailutyökaluksemme GATK:n, joka on yksi suosituimmista työkaluista. Se osoittaa, miten hyvin Dell EMC Ready -ratkaisut HPC-biotieteille pystyvät käsittelemään monimutkaisia ja valtavia NGS-kuormituksia.
Blogin tarkoituksena on tarjota arvokkaita suorituskykytietoja Intel® Xeon® Gold 6248 -suorittimesta BWA-GATK-pipeline-suorituskykytestauksessa Dell EMC Ready Solutions for HPC Lustre Storage -ratkaisuilla (ME4-sarjan päivitys) (2). Xeon® Gold 6248 -suoritin sisältää 20 fyysistä ydintä tai 40 loogista ydintä käytettäessä hypersäikeitä. Testiklusterikokoonpanojen yhteenveto on taulukossa 1.
Dell EMC PowerEdge C6420 | |
---|---|
Suoritin | 2 x Xeon® Gold 6248 20 ydintä, 2,5 GHz (Cascade Lake) |
RAM | 12 x 16 Gt, 2 933 MT/s |
Käyttöjärjestelmä | RHEL 7.6 |
Verkon liitäntä | Intel® Omni-Path |
BIOS-järjestelmän profiili | Optimoitu suorituskyky |
Looginen suoritin | Ei käytössä |
Virtualisointitekniikka | Ei käytössä |
BWA | 0,7,15-r1140 |
Samtools | 1.6 |
GATK (GATK) | 3,6-0-g89b7209 |
Dell EMC Ready -ratkaisu Lustre-tallennukseen | |
---|---|
solmujen määrä | 1x Dell EMC PowerEdge R640 Integrated Manager for Lustre (IML) 2x Dell EMC PowerEdge R740 as Metadata Server (MDS) 2x Dell EMC PowerEdge R740 as Object Storage Server (OSS) |
Suorittimet | IML-palvelin: Kaksi Intel Xeon Gold 5118 (2,3 GHz:n MDS- ja OSS-palvelinta): Kaksi Intel Xeon Gold 6136 -näytönohjainta, 3,00 GHz |
Muisti | IML-palvelin: 12 x 8 Gt:n 2 666 MT/s:n DDR4 RDIMM MDS- ja OSS-palvelimet: 24 x 16 GiB 2 666 MT/s DDR4 RDIMM -muistia |
Ulkoiset tallennusohjaimet |
2 x Dell 12 Gb/s SAS HBA :ta (kussakin MDS-järjestelmässä) 4 x Dellin 12 Gt/s:n SAS HBA -väylää (kussakin käyttöjärjestelmässä) |
Objektitallennuskehikot |
4 x ME4084, yhteensä 336 x 8 Tt:n SAS-kiintolevyä (7 200 kierr./min) |
Metatietojen tallennuskehikko |
1 x ME4024, jossa 24 x 960 Gt:n SAS SSD -asemaa. Tukee jopa 4,68 B:n inodeja |
RAID-ohjaimet | Kaksipuoliset SAS RAID -ohjaimet ME4084- ja ME4024-koteloissa |
Käyttöjärjestelmä | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
BIOS-versio | 1.4.5 |
Intel Omni-Path IFS -versio |
10.8.0.0 |
Lustre-tiedostojärjestelmäversio |
2.10.4 |
IML-versio | 4.0.7.0 |