Passer au contenu principal
  • Passer des commandes rapidement et facilement
  • Afficher les commandes et suivre l’état de votre expédition
  • Profitez de récompenses et de remises réservées aux membres
  • Créez et accédez à une liste de vos produits
  • Gérer vos sites, vos produits et vos contacts au niveau des produits Dell EMC à l’aide de la rubrique Gestion des informations de l’entreprise.

Solution Dell EMC Ready pour les sciences de la vie HPC : Tests de débit du pipeline BWA-GATK avec actualisation du processeur Cascade Lake et lustre ME4

Résumé: Solution Dell EMC Ready pour les sciences de la vie HPC : Tests de débit du pipeline BWA-GATK avec actualisation du processeur Cascade Lake et lustre ME4

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article


Symptômes

La configuration à 64 nœuds de calcul de Dell EMC Ready Solutions for HPC Life Sciences peut traiter 194 génomes par jour (50 fois la profondeur de couverture).

Présentation

Ce lien hypertexte renvoie à un site Web extérieur à Dell Technologies.Appel de variante est un processus par lequel nous identifions les variantes à partir des données de séquence. Ce processus permet de déterminer s’il existe des polymorphismes uniques (SPN), des insertions et des suppressions (indels) et ou des variantes structurelles (VS) à une position donnée dans un génome ou transcriptome individuel. L’objectif principal de l’identification des variations génomiques est le lien avec les maladies humaines. Bien que toutes les maladies humaines ne soient pas associées à des variations génétiques, les appels de variante peuvent fournir des instructions précieuses aux généticiens travaillant sur une maladie particulière causée par des variations génétiques. BWA-GATK est l’un des outils de calcul de séquençage de nouvelle génération (NGS) conçus pour identifier les mutations à la volée et somatiques à partir des données NGS humaines. Il existe quelques outils d’identification de variantes, et nous comprenons qu’il n’y a pas un seul outil qui fonctionne parfaitement (1). Toutefois, nous avons choisi GATK, l’un des outils les plus populaires, comme outil d’analyse comparative, pour démontrer à quel point les solutions Dell EMC Ready Solutions for HPC Life Sciences peuvent traiter des charges applicatives NGS complexes et massives. 
L’objectif de ce blog est de fournir des informations précieuses sur les performances du processeur Intel® Xeon® Gold 6248 pour le benchmark de pipeline BWA-GATK avec dell EMC Ready Solutions for HPC Lustre Storage (actualisation de la série ME4) (2). Le processeur Xeon® Gold 6248 comporte 20 cœurs physiques ou 40 cœurs logiques lors de l’utilisation de l’hyper-threading. Les configurations de cluster de test sont résumées dans le Tableau 1.

Tableau 1 Configuration testée des nœuds de calcul
 
Dell EMC PowerEdge C6420
Processeur 2 x Xeon® Gold 6248 20 cœurs 2,5 GHz (Cascade Lake)
RAM 12 x 16 Go à 2 933 MTp
Système d'exploitation RHEL 7.6
Interconnexion Intel® Omni-Path
Profil système BIOS Performances optimisées
Processeur logique Désactivé
Technologie de virtualisation Désactivé
BWA 0,7.15-r1140
Outils Samtools 1.6
GATK 3,6-0-g89b7209

Les nœuds de calcul testés ont été connectés à Dell EMC Ready Solutions for HPC Lustre Storage via Intel® Omni-Path. La configuration récapitulative du stockage est répertoriée dans le Tableau 2.
Tableau 2 Caractéristiques matérielles et logicielles de la solution
 
Solution Dell EMC Ready pour le stockage Lustre
Nombre de nœuds 1 serveur Dell EMC PowerEdge R640 en tant que Gestionnaire intégré pour Lustre (IML)
2 serveurs Dell EMC PowerEdge R740 en tant que serveur de métadonnées (MDS)
2 serveurs Dell EMC PowerEdge R740 en tant que serveur de stockage en mode objet (OSS)
Processeurs Serveur IML : Deux serveurs MDS et OSS Intel Xeon Gold 5118 à 2,3 GHz
 : Deux processeurs Intel Xeon Gold 6136 à 3 GHz
Mémoire Serveur IML : 12 x 8 Go 2 666 MT/s Serveurs RDIMM
DDR4 MDS et OSS : 24 barrettes RDIMM DDR4 de 16 Gio à 2 666 MT/s
Contrôleurs de stockage
externes
2 adaptateurs HBA SAS Dell 12 Gbit/s (sur chaque MDS)
4 adaptateurs HBA SAS Dell 12 Gbit/s (sur chaque OSS)
Boîtiers de stockage
en mode objet
4 ME4084 avec un total de 336 disques durs SAS NL de 8 To à 7 200 tr/min
Boîtier de stockage de
métadonnées
1 me4024 avec 24 disques SSD SAS de 960 Go. Prend en charge jusqu’à 4,68 inodes B
Contrôleurs RAID Contrôleurs RAID SAS duplex dans les boîtiers ME4084 et ME4024
Système d’exploitation CentOS 7.5 x86_64
Red Hat Enterprise Linux (RHEL) 7.5 x86_64
Version du BIOS 1.4.5
Version INTEL Omni-Path
IFS
10.8.0.0
Version du système
de fichiers Lustre
2.10.4
Version IML 4.0.7.0

Les données de test ont été choisies à partir de l’un des génomes Platinum d’Illumina. ERR194161 a été traité avec Illumina HiSeq 2000 soumis par Illumina et peut être obtenu auprès d’EMBL-EBI. L’identifiant DE L’ADN de cette personne est NA12878. La description des données du site Web lié montre que cet exemple a une >profondeur de couverture de 30 fois.

Évaluation des performances

Performances d’un seul échantillon de plusieurs nœuds

Dans la Figure 1, le runtime dans différents nombres d’échantillons et de nœuds de calcul avec 50 données de séquençage du génome entier (WGS) est résumé. Les tests effectués ici sont conçus pour démontrer les performances au niveau du serveur, et non pour des comparaisons sur des composants individuels. Les points de données de la Figure 1 sont calculés en fonction du nombre total d’échantillons, un échantillon par nœud de calcul (axe X dans la figure) qui sont traités simultanément. Les détails des informations sur le pipeline BWA-GATK peuvent être obtenus à partir du site Web du Broad Institute (3). Le nombre maximal de nœuds de calcul utilisés pour les tests est de 64 C6420s. Les modèles C6420 avec Lustre ME4 présentent un comportement de mise à l’échelle plus efficace que lustre MD3.

  Comparaison des performances entre Lustre MD3 et Lustre ME4
Figure 1 Comparaison des performances entre Lustre MD3 et Lustre ME4

Plusieurs exemples de performances de plusieurs nœuds

Une méthode classique d’exécution du pipeline NGS consiste à exécuter plusieurs échantillons sur un nœud de calcul et à utiliser plusieurs nœuds de calcul pour optimiser le débit du processus de données NGS. Le nombre de nœuds de calcul utilisés pour les tests est de 64 nœuds de calcul C6420 et le nombre d’échantillons par nœud est de cinq échantillons. Jusqu’à 320 échantillons sont traités simultanément pour estimer le nombre maximal de génomes par jour sans échec de tâche.
Comme le montre la Figure 2, un seul nœud de calcul C6420 peut traiter 3,24 génomes humains entiers sur 50 par jour lorsque 5 échantillons sont traités simultanément. Pour chaque échantillon, 7 cœurs et 30 Go de mémoire sont alloués. 

  Tests de débit avec jusqu’à 64 C6420s et lustre ME4
Figure 2 Tests de débit avec jusqu’à 64 C6420s et lustre ME4

320 génomes humains entiers sur 50 peuvent être traités avec 64 nœuds de calcul C6420 en 40 heures.  En d’autres termes, les performances de la configuration de test se résument à 194 génomes par jour pour l’ensemble du génome humain avec une profondeur de couverture de 50 fois.

Conclusion

La taille des données de WGS ne cesse de croître. La taille moyenne actuelle de WGS est de 50 fois. C’est 5 fois plus qu’un WGS standard il y a 4 ans lorsque nous avons commencé à comparer le pipeline BWA-GATK. L’augmentation des données n’affecte pas la capacité du côté stockage, car la plupart des applications du pipeline sont également limitées par la vitesse d’horloge du processeur. Par conséquent, avec la taille croissante des données, le pipeline s’exécute plus longtemps plutôt que de générer plus d’écritures.
Toutefois, il existe un plus grand nombre de fichiers temporaires générés au cours du processus, car plus les données doivent être parallélisées, et ce nombre accru de fichiers temporaires ouverts en même temps épuise la limite de fichiers ouverts dans un système d’exploitation Linux. L’une des applications ne parvient pas à se terminer en mode silencieux en atteignant la limite du nombre de fichiers ouverts. Une solution simple consiste à augmenter la limite à >150 000. 
Néanmoins, la ready solution avec Lustre ME4 en tant qu’espace de travail offre une meilleure capacité de débit que la version précédente. Désormais, 64 nœuds Ready Solution marque 194 génomes par jour de puissance de traitement pour 50 x WGS.

Ressources 

1. Enquête sur les outils d’analyse des variantes des données de séquençage du génome de nouvelle génération. Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabicvb B, Speicher MR, Zschovb J, Traajoski Z. 2, s.l. : Brief Bioinform, 2014 Mar, Vol. 15 (2). 10,1093/bbs086.
2. Dell EMC Ready Solution for HPC Lustre Storage.  (L’article n’est plus disponible pour référence, extrait par l’équipe HPC)
3. Kit d’outils d’analyse du génome. https://software.broadinstitute.org/gatk/ Ce lien hypertexte renvoie à un site Web extérieur à Dell Technologies.

Propriétés de l’article


Produit concerné

ME Series, Dell EMC Ready Solution Resources, PowerEdge C6420, Dell EMC PowerVault ME4024, Dell EMC PowerVault ME4084, Red Hat Enterprise Linux Version 7

Dernière date de publication

11 janv. 2024

Version

6

Type d’article

Solution