Primeros pasos hacia un montaje eficiente del genoma en HPC basado en ARM
Autores: Poje, Kristijan; Brcic, Mario; Knezovic, Josip; Kovac, Mario
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
Los avances exponenciales en potencia computacional han impulsado avances en muchas disciplinas, y la biología no es una excepción. La Computación de Alto Rendimiento (HPC) está ganando terreno como una de las herramientas esenciales en la investigación científica. Los avances en capacidades de exascala requerirán hardware más eficiente en energía. En este artículo, presentamos nuestros esfuerzos para mejorar la eficiencia del ensamblaje del genoma en sistemas HPC basados en ARM. Utilizamos la vectorización para optimizar el popular pipeline de ensamblaje de genomas de minimap2, miniasm y Racon. Comparamos diferentes implementaciones utilizando la arquitectura de conjunto de instrucciones de Vectorización Escalable (SVE) y evaluamos su rendimiento en diferentes aspectos. Además, comparamos el rendimiento de la autovectorización con código ajustado manualmente con intrínsecos. Por último, presentamos el diseño de un despachador de CPU incluido en el módulo de consenso de Racon que permite la selección automática del conjunto de instrucciones más rápido compatible con la CPU utilizada. Nuestros hallazgos ofrecen una dirección prometedora para una mayor optimización del ensamblaje del genoma en sistemas HPC basados en ARM.
Descripción
Los avances exponenciales en potencia computacional han impulsado avances en muchas disciplinas, y la biología no es una excepción. La Computación de Alto Rendimiento (HPC) está ganando terreno como una de las herramientas esenciales en la investigación científica. Los avances en capacidades de exascala requerirán hardware más eficiente en energía. En este artículo, presentamos nuestros esfuerzos para mejorar la eficiencia del ensamblaje del genoma en sistemas HPC basados en ARM. Utilizamos la vectorización para optimizar el popular pipeline de ensamblaje de genomas de minimap2, miniasm y Racon. Comparamos diferentes implementaciones utilizando la arquitectura de conjunto de instrucciones de Vectorización Escalable (SVE) y evaluamos su rendimiento en diferentes aspectos. Además, comparamos el rendimiento de la autovectorización con código ajustado manualmente con intrínsecos. Por último, presentamos el diseño de un despachador de CPU incluido en el módulo de consenso de Racon que permite la selección automática del conjunto de instrucciones más rápido compatible con la CPU utilizada. Nuestros hallazgos ofrecen una dirección prometedora para una mayor optimización del ensamblaje del genoma en sistemas HPC basados en ARM.