Passer au contenu principal
  • Passer des commandes rapidement et facilement
  • Afficher les commandes et suivre l’état de votre expédition
  • Profitez de récompenses et de remises réservées aux membres
  • Créez et accédez à une liste de vos produits
  • Gérer vos sites, vos produits et vos contacts au niveau des produits Dell EMC à l’aide de la rubrique Gestion des informations de l’entreprise.

Aumente la secuenciación genómica con Falcon Accelerated Genomics Pipeline (PIPELINEP) en Intel FPGA PAC

Résumé: Falcon Accelerated Genomics Pipeline con una sola tarjeta de aceleración programable FPGA de Intel puede procesar 50 genomas humanos completos en menos de 3 horas a través de la canalización de llamadas de variantes alternativas. ...

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article


Symptômes

Falcon Accelerated Genomics Pipeline con una sola tarjeta de aceleración programable FPGA de Intel puede procesar 50 genomas humanos completos en menos de 3 horas a través de la canalización de llamadas de variantes alternativas. 

 



Descripción general, Desafío del mercado (necesidad), La solución Falcon responde a la necesidad

La medicina de precisión, la genómica y la epigenética utilizan la secuenciación genómica para realizar investigaciones, mejorar el diagnóstico, desarrollar fármacos, aumentar la calidad de la atención a los proveedores de servicios de salud y optimizar la producción de cultivos. Para las ciencias biológicas, el análisis del genoma ahora es una aplicación clave, debido, en parte, a la gran reducción de costos de la recopilación de datos a partir de los avances en la secuenciación de última generación (NGS). Además del aumento de la recopilación de datos, también ha habido un crecimiento significativo en la gama de aplicaciones genómicas utilizadas en universidades, centros de investigación genómica, empresas farmacéuticas y organizaciones de servicios de salud. 
Cada siete meses, la cantidad de datos del genoma se duplica (1). En consecuencia, el procesamiento de datos de manera eficiente y rentable se ha vuelto fundamental. La potencia computacional de las soluciones de solo procesador no se escala lo suficientemente rápido como para mantenerse al día con el crecimiento de los datos genómicos. Esto ha llevado a la necesidad de aceleración de hardware. Los aceleradores, como los FPGA, se están volviendo fundamentales para satisfacer las exigencias computacionales de esta explosión de datos genómicos. En comparación con otras soluciones aceleradas por hardware, Falcon Accelerated Genomics Pipeline (PIPELINEP) ofrece flexibilidad, alto rendimiento y un menor costo por muestra.
 



Qué es FPGA, oferta intel PAC & advantage

Los FPGA son dispositivos de silicio que se pueden reprogramar dinámicamente con una ruta de datos que coincida exactamente con sus cargas de trabajo, como la secuenciación genómica, la analítica de datos o la compresión, como se ilustra en la figura 1. Esta versatilidad permite el aprovisionamiento de un procesamiento más rápido, una computación más eficiente en el uso de la energía y un servicio de menor latencia, lo que reduce el costo total de propiedad y maximiza la capacidad de procesamiento dentro de las limitaciones de alimentación, espacio y enfriamiento de sus centros de datos. 
Tradicionalmente, los FPGA requieren una profunda pericia en el dominio para programar. Para simplificar el flujo de desarrollo y permitir una implementación rápida en todo el centro de datos, Intel ofrece una plataforma de aceleración que incluye PCI Express* (PCIe*): tarjetas de aceleración programables Intel FPGA (Intel FPGA PAC) y la pila de aceleración intel® para CPU Intel Xeon® con FPGA. Estas plataformas Intel están calificadas, validadas e implementadas a través de Dell EMC. Junto con los socios del ecosistema, como Falcon Computing, Intel Acceleration Platform ofrece una solución confiable y lista para usar con hardware




SLN319291_en_US__1image (12669) transparente.Figura 1 Mejor precisión y velocidad en la canalización GATK estándar
 



Detalles de Falcon Solution:

Genome Analysis Toolkit (GATK) es el estándar de oro para el procesamiento de datos genómicos aceptado por la comunidad genómica (2). Su flujo de trabajo de mejores prácticas (BPW) es conocido por su lentitud en el procesamiento para generar resultados para muestras grandes, como el genoma completo (CSRS). Para abordar este problema, Falcon Computing Solutions ha desarrollado un paquete de software flexible de herramientas que sigue el BPW y se puede implementar fácilmente en varias plataformas y arquitecturas.  Es rápido en varios pedidos de magnitud en comparación con las canalizaciones GATK basadas en CPU.
LAICP proporciona una solución integral para analizar de manera rentable los datos genómicos mediante la canalización de GATK con alto rendimiento, precisión y reproducibilidad. La solución ofrece hasta 15 veces más velocidad con la misma precisión que GATK (3). Esto significa que un análisis que normalmente tarda entre 50 y 60 horas se puede realizar en menos de 4 horas (3). LA CATEGORÍAP proporciona niveles excepcionales de aceleración y precisión junto con procesadores Intel Arria 10 FPGA confiables y de alto rendimiento y procesadores Intel® Xeon®. 
LAP sigue a GATK BPW. Implementa la aceleración en muchos componentes de las canalizaciones, desde la alineación (BWA) hasta la llamada de variantes (HaplotypeCaller) (4). Además de la BWA acelerada, también incluye una versión acelerada del minimap2 alineador que forma parte de la canalización genómica alternativa de Falcon (5).  La canalización alternativa proporciona una solución aún más rápida. Puede completar 50 veces la secuenciación del genoma completo en un plazo de 3 horas. Ambos alineadores tienen la función de generar duplicados marcados y lecturas ordenadas sin necesidad de usar herramientas adicionales. 
LA MTP logra un alto rendimiento mediante la aceleración de la computación intensiva en la canalización GATK mediante las plataformas Intel FPGA PAC. Esto es diferente de las soluciones de escalamiento horizontal que logran un alto rendimiento mediante la adición de más recursos de CPU. Estas soluciones de escalamiento horizontal tienen una capacidad limitada para reducir los costos o la latencia por muestra.
Otra ventaja de la solución Falcon es que es una canalización abierta como GATK. Los usuarios pueden controlar los pasos individuales en las canalizaciones. Los datos intermedios se guardan y se puede acceder a estos.


Tabla 1 Ventajas de la canalización de genómica acelerada de Falcon

 
Ventajas de Falcon Accelerated Genomics Pipeline (PIPELINEP)
Verdadero GATK Compatibilidad con varias versiones de GATK, incluida la versión 4.0
Escala del sector Ejecute cinco genomas completos o 24 totalidades en un día
Variante alternativa < Tiempo de respuesta en las instalaciones de 3 horas para LAS TAREAS (50 veces)
Velocidad Ejecute la canalización de mejores prácticas de GATK hasta >15 veces más rápido
Aprovechar los existentes No es necesario reescribir algoritmos de trabajo
 



Configuración de hardware de Dell

Tabla 2: Dell EMC PowerEdge R740xd como banco de pruebas

Dell EMC PowerEdge R740xd
Procesador 2 CPU Intel(R) Xeon(R) Gold 6148 a 2,40 GHz
Memoria 384 GB a 32 RDIMM de 16 GB, 2666 MT/s, rango doble
Almacenamiento 4 discos duros de conexión en caliente SAS de 1,2 TB, 10,000 r/min, 12 Gbps, 512n y 2,5 in en RAID 0 2 INTEL SSDPEDMD020T4 DC P3700 1.8T en el software RAID 0
FPGA Tarjeta de aceleración programable de Intel con FPGA Intel Arria® 10 GX (Intel Acceleration Stack 1.1)
Perfil del sistema Rendimiento
Versión del BIOS 2.1.3
Hyperthreading Habilitado
SO Red Hat Enterprise Linux Server versión 7.4 (Principalpo) (3.10.0-693.el7.x86_64)



Evaluación del rendimiento

En nuestras pruebas de análisis comparativo, utilizamos datos de secuenciación del genoma humano completo a una cobertura de 10, 30 y 50 veces mayor.


Tabla 3 Prueba de los datos de secuenciación del genoma completo

 
Ejecutar la 24.0 Profundidad de la cobertura Vínculo de datos
ERR091571 10 veces https://www.ebi.ac.uk/ena/data/view/ERR091571
SRR3124837 30 veces https://www.ebi.ac.uk/ena/data/view/SRR3124837
ERR194161 50 veces https://www.ebi.ac.uk/ena/data/view/ERR194161


 

Resultados:

En la tabla 4, se resume el tiempo necesario para completar la canalización de las mejores prácticas de GATK 4.0 en tres ciclos de prueba mediante EL USO de LAP e Intel FPGA PAC alojado en el servidor Dell EMC PowerEdge R740xd.


Tabla 4 Tiempo de ejecución total de canalización de mejores prácticas versión 2.1.1
Muestra Profundidad de la cobertura Prueba 1 Tiempo de ejecución (minutos)
Prueba 2
Prueba 3
ERR091571 10 veces 75.63 76.67 76.38
SRR3124837 30 veces 160.00 162.77 161.38
ERR194161 50 veces 242.97 250.65 247.18

La tabla 5 resume el tiempo (en minutos) que se tarda en completar la canalización alternativa: Falcon Tiempoline durante tres ciclos de prueba mediante EL USO DEP e Intel FPGA PAC alojados en el servidor Dell EMC PowerEdge R740xd.


Tabla 5 Tiempo de ejecución total de la canalización de llamadas de variante alternativa
Muestra Profundidad de la cobertura Prueba 1 Tiempo de ejecución (minutos)
Prueba 2
Prueba 3
ERR091571 10 veces 62.70 58.21 59.80
SRR3124837 30 veces 130.38 129.90 129.95
ERR194161 50 veces 171.52 171.87 171.37
 



Resumen de la solución Falcon Genomic

Falcon Accelerated Genomics Pipeline ofrece un alto rendimiento y un beneficio de bajo costo/muestra/día. Junto con la tarjeta de aceleración programable Intel FPGA y el servidor certificado de DELL, LAP proporciona una solución completa que se puede adoptar fácilmente para sus aplicaciones de secuenciación genómica"
. En TCGB, proporcionamos servicios de secuenciación del genoma a nuestros clientes nacionales. Falcon Accelerated Genomics Pipeline* nos permitió reducir nuestro tiempo de respuesta de días en pocas horas y, al mismo tiempo, mantener la precisión de las canalizaciones GATK estándares del sector".
Dr.MentMentmin Li, director del Centro de Tecnología para Genómica y Bioinformática (TCGB) UCLA



Recursos 

1. La secuenciación del genoma crea tantos datos que no sabemos qué hacer con él. [En línea] https://www.washingtonpost.com/news/speaking-of-science/wp/2015/07/07/sequencing-the-genome-creates-so-much-data-we-don't-know-what-to-do-with-it.
2. GATK. [En línea]
https://software.broadinstitute.org/gatk/3. Genómica acelerada. [En línea]
http://www.falconcomputing.com/falcon-accelerated-genomics-pipeline4. BWA. [En línea]
http://bio-bwa.sourceforge.net/bwa.shtml5. Minimap2. [En línea] https://github.com/lh3/minimap2


Cause

Aumente la secuenciación genómica con Falcon Accelerated Genomics Pipeline (PIPELINEP) en Intel FPGA PAC

Résolution

Falcon Accelerated Genomics Pipeline con una sola tarjeta de aceleración programable FPGA de Intel puede procesar 50 genomas humanos completos en menos de 3 horas a través de la canalización de llamadas de variantes alternativas.

Propriétés de l’article


Produit concerné

Dell EMC Ready Solution Resources, PowerEdge R740XD

Dernière date de publication

03 oct. 2023

Version

4

Type d’article

Solution