Passer au contenu principal
  • Passer des commandes rapidement et facilement
  • Afficher les commandes et suivre l’état de votre expédition
  • Profitez de récompenses et de remises réservées aux membres
  • Créez et accédez à une liste de vos produits
  • Gérer vos sites, vos produits et vos contacts au niveau des produits Dell EMC à l’aide de la rubrique Gestion des informations de l’entreprise.

Genomien sekvensoinnin tehostaminen FAGP (Falcon Accelerated Genomics Pipeline) -toiminnolla Intel FPGA PAC:ssa

Résumé: Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla. ...

Cet article a peut-être été traduit automatiquement. Si vous avez des commentaires concernant sa qualité, veuillez nous en informer en utilisant le formulaire au bas de cette page.

Contenu de l’article


Symptômes

Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla. 

 



Yleiskatsaus, markkinahaaste (tarve), Falcon-ratkaisu vastaa tarpeeseesi

Täsmälääkinnät, genomiikat ja genoneetit käyttävät genomi-sekvensointia tutkimusten suorittamiseen, diagnosoinnin parantamiseen, lääkealan kehittämiseen, terveydenhuollon tarjoajien koulutuksen laadun parantamiseen ja kasvun optimointiin. Biotieteissä genomianalyysi on nyt keskeinen sovellus, koska tiedonkeruukustannukset pienenevät merkittävästi seuraavan sukupolven sekvensoinnin (NGS) edistymisen jälkeen. Tietokokoelman lisääntymisen lisäksi yliopistoissa, genomitutkimuskeskuksissa, lääkeyrityksissä ja terveydenhuollon organisaatioissa käytettävien genomisovellusten valikoima on kasvanut merkittävästi. 
Genomitietojen määrä tuplaantuu seitsemän kuukauden välein (1). Siksi tietojen käsittely tehokkaalla ja kustannustehokkaalla tavalla on muuttunut kriittiseksi. Vain suoritinratkaisujen laskentateho ei skaalautuu genomitietojen kasvun mukana. Tämä on aiheuttanut laitteistokiihdytyksen tarpeen. Kiihdyttimet, kuten FPBA:t, ovat muuttumassa kiertoa vastaamaan tämän genomitietojen räjähdyksen laskentatarpeisiin. FaGP (Falcon Accelerated Genomics Pipeline) on joustava, suuri siirtonopeus ja pienempi näytekohtainen hinta verrattuna muihin laitteistokiihdyttämiin ratkaisuihin.
 



Mikä on FPGA, Intel PAC offering & Advantage

FPBA-laitteet ovat dynaaminen uudelleenohjelmoitavia laitteista, joiden tietopolku vastaa työkuormia täsmälleen, kuten genomien sekvensointi, tietojen analytiikka tai pakkaus, kuten kuvassa 1 on kuvattu. Monipuolisuus mahdollistaa nopeamman käsittelyn, tehokkaamman laskentatehon ja pienemmän viivepalvelun – kokonaiskäyttökustannusten pienentämisen ja laskentakapasiteetin maksimoinnin konesalien virran, tilan ja jäähdytysrajoitusten puitteissa. 
FPBA:t edellyttävät perinteisesti syvällistä toimialueosaamista ohjelmoinnissa. Intel tarjoaa kiihdytysalustan, joka yksinkertaistaa kehityskulkua ja mahdollistaa nopean käyttöönoton konesalissa. Se sisältää PCI Express* (PCIe*) -pohjaiset Intel FPGA -ohjelmoitavat kiihdytyskortit (Intel FPGA PAC) ja Intel® Acceleration Stack for Intel Xeon® -suorittimen ja FPGA-kortit. Nämä Intel-ympäristöt tukevat, validoidaan ja otetaan käyttöön Dell EMC:n kautta. Yhdessä Falcon Computingin kaltaisten ekosysteemikumppaneiden kanssa Intel Acceleration Platform on luotettava ja käyttövalmis ratkaisu, jossa on läpinäkyvät laitteistot konepeitteen alla.



SLN319291_en_US__1image (12669)
Kuva 1: GATK-vakiokanavan parempi tarkkuus ja nopeus
 



Falcon-ratkaisun tiedot:

Genomianalyysityökalut (GATK) on genomitietojen käsittelyn kultastandardi, jonka genomiyhteisö hyväksyy (2). Sen parhaiden käytäntöjen työnkulku (BPW) on tunnettu tietojenkäsittelyn hitaudesta, joka tuottaa tuloksia suurista näytteistä, kuten koko genomista (WGS). Falcon Computing Solutions on kehittänyt joustavan ohjelmistopaketin, joka seuraa BPW-tekniikkaa ja jonka voi ottaa käyttöön helposti useissa ympäristöissä ja arkkitehtuureissa.  Se on nopea usealla eri tilausmäärällä verrattuna suoritinpohjaisiin GATK-myyntiin.
FAGP on kattava ratkaisu, joka analysoi genomitietoja kustannustehokkaasti GATK-väylän avulla sekä tarjoaa erinomaisen suorituskyvyn, tarkkuuden ja toistettavissa olevan ratkaisun. Ratkaisun nopeus on jopa 15 kertaa nopeampi ja täsmällinen kuin GATK:n (3). Tämä tarkoittaa, että analyysi, joka kestää yleensä 50–60 tuntia, voidaan suorittaa alle 4 tunnissa (3). FAGP tarjoaa erinomaista kiihdytystä ja tarkkuutta suorituskykyisten, luotettavien Intel Arria 10 FPGA -suorittimien ja Intel® Xeon® -suorittimien kanssa. 
FAGP noudattaa GATK BPW -parametria. Se kiihdyttää monissa pipeline-toimintojen osissa kohdistuksesta (BWA) versiopuheluihin (HaplotypeCaller) (4). Nopeutetun BWA:n lisäksi se sisältää myös kiihdytetun version aligner Minimap2 -toiminnosta, joka on osa Falconin vaihtoehtoista genomikanavaa (5).  Vaihtoehtoinen pipeline tarjoaa entistä nopeamman ratkaisun. Se voi suorittaa 50 kertaa koko genomin sekvensoinnin 3 tunnin kuluessa. Molemmissa kohdistuksissa on toiminto, joka tuottaa merkittyjä kaksoiskappaleita ja lajiteltuja lukuja ilman lisätyökaluja. 
FAGP parantaa suorituskykyä ja siirtonopeutta nopeuttamalla gatk-toimintojen vaativaa laskentaa Intelin FPGA PAC -alustojen avulla. Tämä eroaa skaalautuvien ratkaisujen suoritustehon saavuttamisesta lisäämällä suorittimen resursseja. Tällaiset skaalautuvat ratkaisut voivat vähentää kustannuksia tai esimerkkikohtaisia viivettä.
Falcon-ratkaisun toinen etu on, että kyseessä on avoin myynti GATK-ratkaisuna. Käyttäjät voivat hallita eri vaiheita pipeline-toiminnoissa. Välitiedot tallennetaan ja niitä voi käyttää.


Taulukko 1 Falcon-kiihdytettyjen genomiikan putken edut

 
FaGP (Falcon Accelerated Genomics Pipeline) -edut
True GATK Useiden GATK-versioiden tuki, mukaan lukien 4.0
Toimialan skaalaus Suorita viisi koko genomia tai 24 kokonaista exomea yhdessä päivässä
Vaihtoehtoinen versio < WGS:n 3 tunnin toimitusaika prem-prem-määrityksessä (50 x)
Nopeus GATK-käytäntöjen siirto jopa >15 kertaa nopeammin
Hyödynnä olemassa olevia Ei tarvitse kirjoittaa uudelleen toimivia algoritmeja
 



Dellin laitteistokokoonpano

Taulukko 2: Dell EMC PowerEdge R740xd testisänkynänä

Dell EMC PowerEdge R740xd
Suoritin 2 x Intel(R) Xeon(R) Gold 6148 -suoritin @ 2,4 GHz
Muisti 384 Gt , 32 x 16 Gt:n RDIMM, 2 666 MT/s, Dual Rank
Tallennustila 4 x 1,2 Tt:n SAS 10 000 kierr./min, 12 Gbps 512n 2,5 tuuman käytön aikana vaihdettava kiintolevy RAID 0 2x INTEL SSDPEDMD020T4 DC P3700 1.8T ohjelmisto-RAID 0:ssa
FPGA IntelIn ohjelmoitava kiihdytyskortti, jossa Intel Arria® 10 GX FPGA (Intel Acceleration Stack 1.1)
Järjestelmän profiili Suorituskyky
BIOS-versio 2.1.3
Hypersäikeistys Käytössä
Käyttöjärjestelmä Red Hat Enterprise Linux Server release 7.4 (Maipo) (3.10.0-693.el7.x86_64)



Suorituskyvyn arviointi

Testitestauksessa käytimme ihmisen koko perimän sekvensointia 10 x, 30 ja 50 kertaa syvyyteen.


Taulukko 3 Testatut koko genomin sekvensointitiedot

 
Suorita siunaaminen Kattavuussyvyys Tietolinkki
ERR091571 10 x https://www.ebi.ac.uk/ena/data/view/ERR091571
SRR3124837 30 x https://www.ebi.ac.uk/ena/data/view/SRR3124837
ERR194161 50 x https://www.ebi.ac.uk/ena/data/view/ERR194161


 

Tulokset:

Taulukossa 4 on yhteenveto ajasta, joka kului GATK 4.0 Best Practices Pipeline -toiminnossa kolmen testisyklin aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimen Intelin FPGA PAC -toiminnolla.


Taulukko 4 Parhaiden käytäntöjen Pipeline-version 2.1.1 käyttöajat yhteensä
Näyte Kattavuussyvyys Testi 1 Kesto (min)
Testi 2
Testi 3
ERR091571 10 x 75.63 76.67 76.38
SRR3124837 30 x 160.00 162.77 161.38
ERR194161 50 x 242.97 250.65 247.18

Taulukossa 5 on yhteenveto ajasta (minuutteina), joka kuluu vaihtoehtoisen pipeline-ratkaisun suorittamiseen: Falcon Cremline kolmen testijakson aikana FAGP:n ja DELL EMC PowerEdge R740xd -palvelimeen tallennetun Intelin FPGA PAC -ohjaimen avulla.


Taulukko 5 Vaihtoehtoisten versioiden myyntikertoja yhteensä
Näyte Kattavuussyvyys Testi 1 Kesto (min)
Testi 2
Testi 3
ERR091571 10 x 62.70 58.21 59.80
SRR3124837 30 x 130.38 129.90 129.95
ERR194161 50 x 171.52 171.87 171.37
 



Falcon-genomiratkaisun yhteenveto

Falcon Accelerated Genomics Pipeline tarjoaa suuren siirtonopeuden, edulliset/esimerkki-/päiväedut. FAGP on täydellinen ratkaisu, jonka voi ottaa käyttöön helposti genomien sekvensointisovelluksissa yhdessä Intel FPGA Programmable Acceleration Cardin ja sertifioidun DELL-palvelimen kanssa.
" Tarjoamme TCGB:llä genomin sekvensointipalveluja virtuaaliasiakkaillemme. Falcon-kiihdytetty genomiikkamyynti* on mahdollistanut sen, että toimitusaikamme on katkaistu muutamasta tunnista ja alan standardinmukaisten GATK-myyntien tarkkuus pysyy edelleen hyvänä."
— Genomiikan ja bioinformatiikan (TCGB) TEKNOLOGIAKESKUKSEN johtaja Xinmin Li



Resursseja 

1. Perimän sekvensointi luo niin paljon tietoja, että emme tiedä, mitä tehdä sille. [Online] https://www.washingtonpost.com/news/speaking-of-science/wp/2015/07/07/sequencing-the-genome-creates-so-much-data-we-don-t-know-what-to-do-with-it.
2. GATK-JÄNNITYS [Online]
https://software.broadinstitute.org/gatk/3. Kiihdytetty genomiikka. [Online]
http://www.falconcomputing.com/falcon-accelerated-genomics-pipeline4. BWA. [Online]
http://bio-bwa.sourceforge.net/bwa.shtml5. Minimap2. [Online] https://github.com/lh3/minimap2


Cause

Genomien sekvensoinnin tehostaminen FAGP (Falcon Accelerated Genomics Pipeline) -toiminnolla Intel FPGA PAC:ssa

Résolution

Falcon-kiihdytetty genomiikkaväylä, jossa on yksi Intelin FPGA-ohjelmoitava kiihdytyskortti, pystyy käsittelemään 50 kertaa kokonaisia ihmisen genomeja alle 3 tunnissa alternative variant calling pipeline -toiminnolla.

Propriétés de l’article


Produit concerné

Dell EMC Ready Solution Resources, PowerEdge R740XD

Dernière date de publication

03 oct. 2023

Version

4

Type d’article

Solution