Gotowe rozwiązanie Dell EMC Ready Solution do wykorzystania HPC w naukach przyrodniczych: testy przepływności potoku BWA-GATK z procesorem Cascade Lake i odświeżaniem Lustre ME4

Summary: Archiwizacja jako artykuł jest oparty na dokumentacji HPC, która nie jest już hostowana online, a artykuł nie może być edytowany zgodnie z oczekiwaniami bazy wiedzy Gotowe rozwiązanie HPC firmy Dell EMC dla nauk przyrodniczych: testy przepływności potoku BWA-GATK z procesorem Cascade Lake i odświeżaniem Lustre ME4 ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Gotowe rozwiązania Dell EMC Ready Solutions dla systemów HPC dla nauk przyrodniczych w konfiguracji z 64 węzłami obliczeniowymi umożliwiają przetwarzanie 194 genomów dziennie (50-krotnie większa głębokość pokrycia).

Omówienie

WywoływanieKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies. wariantów to proces, w którym identyfikujemy warianty na podstawie danych sekwencyjnych. Proces ten pomaga określić, czy w danym miejscu w pojedynczym genomie lub transkryptomie występują polimorfizmy pojedynczych nukleotydów (SNP), insercje i delecje (indele) i/lub warianty strukturalne (SV). Głównym celem identyfikacji zmienności genomowej jest powiązanie z chorobami ludzkimi. Chociaż nie wszystkie ludzkie choroby są związane ze zmianami genetycznymi, wywoływanie wariantów może stanowić cenną wskazówkę dla genetyków pracujących nad konkretną chorobą spowodowaną zmiennościami genetycznymi. BWA-GATK jest jednym z narzędzi obliczeniowych sekwencjonowania nowej generacji (NGS), które są przeznaczone do identyfikacji mutacji germinalnych i somatycznych na podstawie danych NGS u ludzi. Istnieje kilka narzędzi do identyfikacji wariantów i rozumiemy, że nie ma ani jednego narzędzia, które działałoby idealnie (1). Wybraliśmy jednak GATK, które jest jednym z najpopularniejszych narzędzi, jako narzędzie testowe, aby zademonstrować, jak dobrze gotowe rozwiązania Dell EMC dla HPC dla nauk przyrodniczych mogą przetwarzać złożone i ogromne obciążenia robocze NGS. 
Celem tego bloga jest dostarczenie cennych informacji na temat wydajności procesora Intel® Xeon® Gold 6248 w teście porównawczym potoku BWA-GATK z gotowymi rozwiązaniami Dell EMC dla pamięci masowej HPC Lustre (odświeżenie serii ME4) (2). Procesor Xeon® Gold 6248 ma 20 rdzeni fizycznych lub 40 rdzeni logicznych w przypadku korzystania z wielowątkowości. Konfiguracje klastrów testowych podsumowano w tabeli 1.

Tabela 1: Testowana konfiguracja węzła obliczeniowego
 
Dell EMC PowerEdge C6420
Procesor 2x Xeon® Gold 6248 20 rdzeni 2,5 GHz (Cascade Lake)
RAM 12 x 16 GB przy 2933 MTps
System operacyjny RHEL 7.6
Połączenia Intel® Omni-Path
Profil systemu BIOS Zoptymalizowana wydajność
Procesor logiczny Disabled
Technologia wirtualizacji Disabled
BWA 0.7.15-R1140
Samtools (Samtools) 1.6
GATK 3.6-0-G89B7209

Przetestowane węzły obliczeniowe zostały podłączone do rozwiązań Dell EMC Ready Solutions dla pamięci masowej HPC Lustre za pośrednictwem technologii Intel® Omni-Path. Podsumowanie konfiguracji pamięci masowej przedstawiono w tabeli 2.
Tabela 2. Dane techniczne sprzętu i oprogramowania rozwiązania
 
Gotowe rozwiązanie Dell EMC Ready Solution dla pamięci masowej Lustre
Liczba węzłów 1 serwer Dell EMC PowerEdge R640 jako zintegrowany menedżer narzędzia Lustre (IML)
2 serwery Dell EMC PowerEdge R740 jako serwer metadanych (MDS)
2 serwery Dell EMC PowerEdge R740 jako serwer pamięci obiektowej (OSS)
Procesory Serwer IML: Dwa procesory Intel Xeon Gold 5118 @ 2,3 GHz
Serwery MDS i OSS: dwa procesory Intel Xeon Gold 6136 przy 3,00 GHz
Pamięć Serwer IML: 12 x 8 GB modułów RDIMM DDR4 2666 MT/s,
MDS i OSS: 24 moduły RDIMM 16 GiB, DDR4, 2666 MT/s
Zewnętrzne kontrolery pamięci masowej
2 karty Dell SAS HBA 12 Gb/s (w każdym systemie MDS)
4 kontrolery Dell 12 Gb/s SAS HBA (w każdym systemie operacyjnym)
Obudowy do przechowywania
obiektów
4 obudowy ME4084 o łącznej liczbie 336 dysków twardych NL, 8 TB, 7,2 tys. obr./min
Obudowa pamięci masowej
na metadane
1 obudowa ME4024 o 24 dyskach SSD SAS, 960 GB. Obsługa do 4,68 B i-węzłów
Kontrolery RAID Kontrolery duplex SAS RAID w obudowach ME4084 i ME4024
System operacyjny CentOS 7.5 x86_64
Red Hat Enterprise Linux (RHEL) 7.5 x86_64
Wersja systemu BIOS 1.4.5
Wersja Intel Omni-Path
IFS
10.8.0.0
Wersja systemu
plików Lustre
2.10.4
Wersja IML 4.0.7.0

Dane testowe zostały wybrane z jednego z Platinum Genomes firmy Illumina. ERR194161 został przetworzony za pomocą Illumina HiSeq 2000 przesłanego przez Illumina i można go uzyskać od EMBL-EBI. Identyfikator DNA tej osoby to NA12878. Z opisu danych z podlinkowanej strony internetowej wynika, że ta próbka ma 30-krotną >głębokość pokrycia.

Ocena wydajności

Wydajność pojedynczej próbki, wielu węzłów

Na rysunku 1 podsumowano czas pracy w różnej liczbie próbek i węzłów obliczeniowych z 50-krotnymi danymi sekwencjonowania całego genomu (WGS). Przeprowadzane tutaj testy mają na celu zademonstrowanie wydajności na poziomie serwera, a nie porównania poszczególnych komponentów. Punkty danych na rysunku 1 są obliczane na podstawie całkowitej liczby próbek, jedna próbka na węzeł obliczeniowy (oś X na rysunku), które są przetwarzane współbieżnie. Szczegółowe informacje na temat rurociągu BWA-GATK można uzyskać na stronie internetowej Broad Institute (3). Maksymalna liczba węzłów obliczeniowych używanych do testów to 64x C6420. C6420s z Lustre ME4 wykazują lepsze zachowanie skalowania niż Lustre MD3.

 Porównanie wydajności między Lustre MD3 i Lustre ME4
Rysunek 1 Porównanie wydajności pomiędzy Lustre MD3 i Lustre ME4

Wydajność wielu próbek i wielu węzłów

Typowym sposobem uruchamiania potoku NGS jest uruchomienie wielu próbek w węźle obliczeniowym i użycie wielu węzłów obliczeniowych w celu zmaksymalizowania przepływności przetwarzania danych NGS. Liczba węzłów obliczeniowych używanych do testów to 64 węzły obliczeniowe C6420, a liczba próbek na węzeł to pięć próbek. Jednocześnie przetwarzanych jest do 320 próbek, aby oszacować maksymalną liczbę genomów dziennie bez niepowodzenia zadania.
Jak pokazano na rysunku 2, pojedynczy węzeł obliczeniowy C6420 może przetwarzać 3,24 z 50 razy całych genomów ludzkich dziennie, gdy jednocześnie przetwarzanych jest 5 próbek. Dla każdej próbki przydzielanych jest 7 rdzeni i 30 GB pamięci. 

 Testy przepustowości z maksymalnie 64 procesorami C6420 i Lustre ME4
Rysunek 2 Testy przepustowości z maksymalnie 64 procesorami C6420 i Lustre ME4

320 z 50 całych genomów ludzkich można przetworzyć za pomocą 64 węzłów obliczeniowych C6420 w ciągu 40 godzin.  Innymi słowy, wydajność konfiguracji testowej podsumowuje się jako 194 genomy dziennie dla całego ludzkiego genomu z 50-krotną głębokością pokrycia.

Wnioski

Ponieważ rozmiar danych WGS stale rośnie. Obecny średni rozmiar WGS wynosi 50x. Jest to 5 razy więcej niż typowy WGS 4 lata temu, kiedy zaczęliśmy porównywać potok BWA-GATK. Rosnąca ilość danych nie obciąża pojemności po stronie pamięci masowej, ponieważ większość aplikacji w potoku jest również ograniczona szybkością zegara procesora. W związku z tym wraz ze wzrostem rozmiaru danych potok działa dłużej, zamiast generować więcej zapisów.
Jednak w trakcie procesu generowana jest większa liczba plików tymczasowych, ponieważ więcej danych musi być zrównoleglonych, a ta zwiększona liczba otwartych plików tymczasowych w tym samym czasie wyczerpuje limit otwartych plików w systemie operacyjnym Linux. Jedna z aplikacji po cichu kończy pracę po przekroczeniu limitu liczby otwartych plików. Prostym rozwiązaniem jest zwiększenie limitu do >150K. 
Niemniej jednak Ready Solution z Lustre ME4 jako przestrzenią do magazynowania ma lepszą przepustowość niż poprzednia wersja. Teraz 64 węzły Ready Solution oznaczają 194 genomy dziennie o mocy obliczeniowej 50x WGS.

Resources 

1. Przegląd narzędzi do analizy wariantów danych sekwencjonowania genomu nowej generacji. Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z. 2, s.l. : Brief Bioinform, marzec 2014, tom 15 (2). 10.1093/bib/bbs086.
2. Dell EMC Ready Solution for HPC Lustre Storage.  (Artykuł nie jest już dostępny, został usunięty przez zespół HPC)
3. Zestaw narzędzi do analizy genomu. https://software.broadinstitute.org/gatk/Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.

Cause

Archiwizacja jako artykuł jest oparty na dokumentacji HPC, która nie jest już hostowana online, a artykuł nie może być edytowany zgodnie z oczekiwaniami bazy wiedzy

Resolution

Archiwizacja jako artykuł jest oparty na dokumentacji HPC, która nie jest już hostowana online, a artykuł nie może być edytowany zgodnie z oczekiwaniami bazy wiedzy

Affected Products

Dell EMC Ready Solution Resources, PowerEdge C6420, Dell EMC PowerVault ME4024, Dell EMC PowerVault ME4084, Red Hat Enterprise Linux Version 7
Article Properties
Article Number: 000176939
Article Type: Solution
Last Modified: 25 Sep 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.