Конфігурація 64-обчислювальних вузлів Dell EMC Ready Solutions for HPC Life Sciences може обробляти 194 геноми на день (50-кратна глибина покриття).
Огляд
Варіанти виклику — це процес, за допомогою якого ми ідентифікуємо варіанти з даних послідовностей. Цей процес допомагає визначити, чи існують однонуклеотидні поліморфізми (SNP), вставки та делеції (індели) та/або структурні варіанти (SV) у певній позиції в окремому геномі або транскриптомі. Основною метою виявлення геномних варіацій є зв'язок із захворюваннями людини. Хоча не всі захворювання людини пов'язані з генетичними варіаціями, виклик варіантів може стати цінним орієнтиром для генетиків, які працюють над конкретним захворюванням, викликаним генетичними варіаціями. BWA-GATK — це один із обчислювальних інструментів секвенування наступного покоління (NGS), який призначений для ідентифікації зародкової лінії та соматичних мутацій на основі даних NGS людини. Існує кілька інструментів ідентифікації варіантів, і ми розуміємо, що не існує жодного інструменту, який би працював ідеально (1). Однак ми вибрали GATK, який є одним із найпопулярніших інструментів, як наш інструмент порівняльного аналізу, щоб продемонструвати, наскільки добре Dell EMC Ready Solutions for HPC Life Sciences може обробляти складні та масивні робочі навантаження NGS.
Метою цього блогу є надання цінної інформації про продуктивність процесора Intel® Xeon® Gold 6248 для тесту трубопроводу BWA-GATK з Dell EMC Ready Solutions for HPC Lustre Storage (оновлення серії ME4) (2). Процесор Xeon® Gold 6248 оснащений 20 фізичними ядрами або 40 логічними ядрами при використанні гіперпоточності. Конфігурації тестових кластерів узагальнені в таблиці 1.
Dell EMC PowerEdge C6420 | |
---|---|
ЦП | 2x Xeon® Gold 6248 20 ядер 2,5 ГГц (Cascade Lake) |
БАРАН | 12x 16 ГБ зі швидкістю 2933 МТс |
ОС | ХЕЛ 7.6 |
З'єднання | ® Intel Omni-Path |
Профіль системи BIOS | Оптимізована продуктивність |
Логічний процесор | Вимкнуто |
Технологія віртуалізації | Вимкнуто |
BWA | 0.7.15-R1140 |
Samtools | 1.6 |
ГАТК | 3.6-0-g89b7209 |
Готове рішення Dell EMC для зберігання блиску | |
---|---|
Кількість вузлів | 1x Dell EMC PowerEdge R640 як інтегрований менеджер для Lustre (IML) 2x Dell EMC PowerEdge R740 як сервер метаданих (MDS) 2x Dell EMC PowerEdge R740 як сервер об'єктного зберігання (OSS) |
Процесори | IML-сервер: Два сервери Intel Xeon Gold 5118 @ 2.3 ГГц MDS і OSS: Два процесори Intel Xeon Gold 6136 @ 3.00 ГГц |
Пам'ять | IML-сервер: 12 x 8 ГБ 2 666 МТ/с DDR4 RDIMM, сервери MDS і OSS: 24 x 16 Гб, 2 666 МТ/с DDR4 RDIMM |
Зовнішні контролери пам'яті |
2 x Dell 12 Гбіт/с SAS HBA (на кожному MDS) 4 x Dell 12 Гбіт/с SAS HBA (на кожному OSS) |
Корпуси для зберігання об'єктів |
4x ME4084 із загальною кількістю жорстких дисків SAS 336 x 8 ТБ NL 7,2 K об/хв |
Корпус для зберігання метаданих |
1x ME4024 з 24 твердотільними накопичувачами SAS по 960 ГБ. Підтримка до 4,68 B inodes |
RAID-контролери | Дуплексні SAS RAID-контролери в корпусах ME4084 і ME4024 |
Операційна система | CentOS 7.5 x86_64 Red Hat Enterprise Linux (RHEL) 7.5 x86_64 |
Версія BIOS | 1.4.5 |
Версія Intel Omni-Path IFS |
10.8.0.0 |
Версія файлової системи Lustre |
2.10.4 |
Версія IML | 4.0.7.0 |