「PowerEdge:Intel FPGA PACにおける、Falcon Accelerated Genomics Pipeline(FAGP)を使用したゲノム配列解析の強化
Summary: 1枚のインテルFPGAプログラマブル・アクセラレーション・カードを搭載したFalcon Accelerated Genomics Pipelineは、代替バリアント呼び出しパイプラインを使用して、50倍の全ヒトゲノムを3時間未満で処理できます。
Symptoms
1枚のインテルFPGAプログラマブル・アクセラレーション・カードを搭載したFalcon Accelerated Genomics Pipelineは、代替バリアント呼び出しパイプラインを使用して、50倍の全ヒトゲノムを3時間未満で処理できます。
概要、市場の課題(ニーズ)、次のニーズに対応するFalconソリューション:
精密医療、ゲノミクス、エピジェネティクスでは、ゲノム シーケンシングを使用して研究を行い、診断を改善し、医薬品を開発し、医療従事者のケアの質を向上させ、作物生産を最適化しています。ライフサイエンスでは、次世代シーケンシング(NGS)の進歩によるデータ収集の大幅なコスト削減もあって、ゲノム解析が重要なアプリケーションとなっています。データ収集の増加に加えて、大学、ゲノム研究センター、製薬会社、医療機関で使用されるゲノムアプリケーションの範囲も大幅に拡大しています。
ゲノム データの量は 7 か月ごとに倍増しています (1)。効率的かつコスト パフォーマンスに優れた方法でデータを処理することが重要になっています。プロセッサーのみのソリューションの計算能力は、ゲノム データの増加に追いつくのに十分な速さで拡張されていません。これにより、ハードウェアアクセラレーションが必要になりました。FPGAなどのアクセラレーターは、このゲノム データの爆発的な増加に伴う計算需要に対応する上で極めて重要になりつつあります。他のハードウェアアクセラレーションソリューションと比較して、Falcon Accelerated Genomics Pipeline(FAGP)は、柔軟性、高スループット、およびサンプルあたりのコストの削減を提供します。
FPGA、インテルPAC製品とそのメリットについて:
FPGAは、図1に示すように、ゲノム配列決定、データ分析、圧縮など、ワークロードと完全に一致するデータパスで動的に再プログラムできるシリコンデバイスです。この汎用性により、より高速な処理、より電力効率の高い計算、および低レイテンシー サービスのプロビジョニングが可能になり、総所有コストを削減し、データセンターの電力、スペース、冷却の制約内でコンピューティング容量を最大化できます。
従来、FPGAのプログラミングには深い専門知識が必要でした。開発フローを簡素化し、データ センター全体への迅速な導入を可能にするため、インテルは、PCI Express* (PCIe*)ベースのインテルFPGAプログラマブル・アクセラレーション・カード(インテルFPGA PAC)を含むアクセラレーション・プラットフォームと、インテルXeon® CPU用FPGA用アク®セラレーション・スタックを提供しています。これらのインテル プラットフォームは、Dell EMCを通じて認定、検証、導入されています。インテル アクセラレーション・プラットフォームは、Falcon Computingなどのエコシステム パートナーと連携して、内部に透過的なハードウェアを備えた信頼性の高いすぐに使用できるソリューションを提供します
図1: 標準的なGATKパイプラインでの精度と速度の向上
Falconソリューションの詳細:
Genome Analysis Toolkit (GATK) は、ゲノミクス コミュニティで受け入れられているゲノム データ処理のゴールド スタンダードです (2)。そのベストプラクティスワークフロー(BPW)は、全ゲノム(WGS)などの大きなサンプルの結果を生成するための計算が遅いことでよく知られています。この問題に対処するために、Falcon Computing Solutionsは、BPWに準拠し、複数のプラットフォームとアーキテクチャに実装できる柔軟なツールのソフトウェアパッケージを開発しました。CPUベースのGATKパイプラインと比較すると、数桁高速です
FAGPは、高性能、正確性、再現性を備えたGATKパイプラインを使用して、ゲノムデータをコスト効率よく解析するためのエンドツーエンドのソリューションを提供します。このソリューションは、GATK (3) と同じ精度で最大 15 倍の高速化を実現します。これは、通常50〜60時間かかる分析を4時間未満で実行できることを意味します(3)。FAGPは、高性能で信頼性の高いインテルArria 10 FPGAとインテル® Xeon®プロセッサーにより、並外れたレベルの高速化と精度を提供します。
FAGPはGATK BPWに従います。パイプラインの多くのコンポーネントで、アラインメント (BWA) からバリアント呼び出し (HaplotypeCaller) までの高速化を実装します (4)。加速されたBWAに加えて、Falcon(5)の代替ゲノムパイプラインの一部であるアライナーMinimap2の加速バージョンも含まれています。代替パイプラインは、さらに高速なソリューションを提供します。3時間以内に50倍速の全ゲノムシーケンシングを完了できます。どちらのアライナーも、追加のツールを使用せずに、マークされた重複とソートされたリードを生成する機能を備えています。
FAGPは、インテルFPGA PACプラットフォームを使用してGATKパイプラインでの集中的な計算を高速化することで、高いパフォーマンス/スループットを実現します。これは、CPUリソースを追加することで高スループットを実現するスケールアウト ソリューションとは異なります。このようなスケールアウトソリューションでは、コストやサンプルあたりのレイテンシーを削減する能力が限られています
Falconソリューションのもう一つの利点は、GATKのようなオープンなパイプラインであることです。ユーザーは、パイプライン内の個々のステップを制御できます。中間データが保存され、アクセスできるようになります
表1: Falcon Accelerated Genomics Pipelineの利点
| Falcon Accelerated Genomics Pipeline(FAGP)の利点 | |
|---|---|
| 真のGATK | 4.0 を含む複数の GATK バージョンのサポート |
| 産業規模 | 1 日で 5 つの全ゲノムまたは 24 の全エクソームを実行します。 |
| 代替バリアント | < WGSのオンサイトでの所要時間は3時間(50X) |
| スピード | GATKのベスト プラクティス パイプラインを最大 >15倍の速度で実行します。 |
| 既存のリソースを活用 | 動作中のアルゴリズムを書き直す必要はありません。 |
Dellハードウェア構成
表2: テストベッドとしてのDell EMC PowerEdge R740xd
| Dell EMC PowerEdge R740xd | |
|---|---|
| CPU | 2x Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz |
| メモリー | 384GB @ 32x 16GB RDIMM, 2666MT/s, Dual Rank |
| ストレージ | 4x 1.2TB 10K RPM SAS 12Gbps 512n 2.5in Hot-plug Hard Drive in RAID 0 2x INTEL SSDPEDMD020T4 DC P3700 1.8T in software RAID 0 |
| FPGAの | Intel Programmable Acceleration Card with Intel Arria® 10 GX FPGA (Intel Acceleration Stack 1.1) |
| システムプロファイル | Performance |
| BIOSのバージョン | 2.1.3 |
| ハイパースレッディング | Enabled |
| OS | Red Hat Enterprise Linux Server release 7.4 (Maipo) (3.10.0-693.el7.x86_64) |
パフォーマンスの評価
ベンチマーク テストでは、10倍、30倍、50倍の範囲深度でヒトゲノム シークエンシング データを使用しました
表3: テスト済みの全ゲノムシーケンシングデータ
| アクセッションの実行 | カバレッジの深さ | データリンク |
|---|---|---|
| ERR091571 | 10倍速 | https://www.ebi.ac.uk/ena/data/view/ERR091571 |
| SRR3124837 | 30倍速 | https://www.ebi.ac.uk/ena/data/view/SRR3124837 |
| ERR194161 | 50倍速 | https://www.ebi.ac.uk/ena/data/view/ERR194161 |
テスト結果:
表4は、FAGPと、DELL EMC PowerEdge R740xdサーバーに搭載されたインテルFPGA PACを使用して、3回のテスト サイクルにわたってGATK 4.0ベスト プラクティス パイプラインを完了するのに要した時間をまとめたものです。
表4: Best Practice Pipelineバージョン2.1.1からの合計実行時間
| 見本 | カバレッジの深さ | テスト1 | 実行時間(分) テスト2 |
テスト3 |
|---|---|---|---|---|
ERR091571 |
10x |
75.63 |
76.67 |
76.38 |
SRR3124837 |
30x |
160.00 |
162.77 |
161.38 |
ERR194161 |
50x |
242.97 |
250.65 |
247.18 |
表5は、代替パイプラインの完了に要した時間(分単位)をまとめたものです。FAGPと、DELL EMC PowerEdge R740xdサーバーに搭載されたインテルFPGA PACを使用して、3サイクルにわたるFalcon Germlineを比較しました。
表5: 代替バリアント呼び出しパイプラインからの合計実行時間
| 見本 | カバレッジの深さ | テスト1 | 実行時間(分) テスト2 |
テスト3 |
|---|---|---|---|---|
ERR091571 |
10x |
62.70 |
58.21 |
59.80 |
SRR3124837 |
30x |
130.38 |
129.90 |
129.95 |
ERR194161 |
50x |
171.52 |
171.87 |
171.37 |
Falcon Genomic Solutionの概要
Falcon Accelerated Genomics Pipelineは、高スループット、低コスト/サンプル/日のメリットを提供します。インテルFPGAプログラマブル・アクセラレーション・カードおよび認定Dellサーバーとともに、FAGPはゲノム配列決定アプリケーションに採用できる完全なソリューションを提供します
"TCGBでは、全国のお客様にゲノム配列決定サービスを提供しています。Falcon Accelerated Genomics Pipeline*により、業界標準のGATKパイプラインの精度を維持しながら、ターンアラウンドを数日から数時間に短縮することができました
— Xinmin Li博士、UCLAゲノミクス・バイオインフォマティクス技術センター(TCGB)所長
リソース
1.ゲノムのシーケンシングでは、非常に多くのデータが作成されるため、それをどう処理すればよいかわかりません。[オンライン] https://www.washingtonpost.com/news/speaking-of-science/wp/2015/07/07/sequencing-the-genome-creates-so-much-data-we-don't-know-what-to-do-with-it.
2.GATK [オンライン] https://software.broadinstitute.org/gatk/
3.加速ゲノミクス [オンライン] http://www.falconcomputing.com/falcon-accelerated-genomics-pipeline
4.BWAです。[オンライン] http://bio-bwa.sourceforge.net/bwa.shtml
5.ミニマップ2です。[オンライン] https://github.com/lh3/minimap2