Modelado de Redes Neuronales Profundas Interpretable y Predictivo de la Secuencia de la Proteína Spike del SARS-CoV-2 para Predecir la Severidad de la Enfermedad COVID-19
Autores: Sokhansanj, Bahrad A.; Zhao, Zhengqiao; Rosen, Gail L.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Covid-19
Mutaciones
Gravedad de la enfermedad
Modelo predictivo
Red neuronal
Proteína de espiga
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
A través de la pandemia de COVID-19, el SARS-CoV-2 ha ganado y perdido múltiples mutaciones en combinaciones novedosas o inesperadas. Predecir cómo las mutaciones complejas afectan la gravedad de la enfermedad COVID-19 es fundamental para planificar las respuestas de salud pública a medida que el virus continúa evolucionando. Este documento presenta un nuevo marco computacional para complementar la clasificación convencional de linajes y lo aplica para predecir el potencial de enfermedad grave de la variación genética viral. La arquitectura del modelo de red neuronal basada en transformadores tiene capas adicionales que proporcionan incrustaciones de muestra y atención a lo largo de la secuencia para la interpretación y visualización. Primero, entrenar un modelo para predecir la taxonomía del SARS-CoV-2 valida la interpretabilidad de la arquitectura. En segundo lugar, se entrena un modelo predictivo interpretable de la gravedad de la enfermedad utilizando la secuencia de la proteína espiga y los metadatos de los pacientes de GISAID. Los efectos confusos de los cambios en la demografía de los pacientes, el aumento de las tasas de vacunación y la mejora del tratamiento a lo largo del tiempo se abordan incluyendo la demografía y la fecha del caso como entradas independientes al modelo de red neuronal. El modelo resultante puede interpretarse para identificar mutaciones virales potencialmente significativas y demuestra ser una herramienta predictiva robusta. Aunque se entrenó con datos de secuencia obtenidos completamente antes de la disponibilidad de datos empíricos para Omicron, el modelo puede predecir el riesgo reducido de enfermedad grave de Omicron, de acuerdo con los datos epidemiológicos y experimentales.
Descripción
A través de la pandemia de COVID-19, el SARS-CoV-2 ha ganado y perdido múltiples mutaciones en combinaciones novedosas o inesperadas. Predecir cómo las mutaciones complejas afectan la gravedad de la enfermedad COVID-19 es fundamental para planificar las respuestas de salud pública a medida que el virus continúa evolucionando. Este documento presenta un nuevo marco computacional para complementar la clasificación convencional de linajes y lo aplica para predecir el potencial de enfermedad grave de la variación genética viral. La arquitectura del modelo de red neuronal basada en transformadores tiene capas adicionales que proporcionan incrustaciones de muestra y atención a lo largo de la secuencia para la interpretación y visualización. Primero, entrenar un modelo para predecir la taxonomía del SARS-CoV-2 valida la interpretabilidad de la arquitectura. En segundo lugar, se entrena un modelo predictivo interpretable de la gravedad de la enfermedad utilizando la secuencia de la proteína espiga y los metadatos de los pacientes de GISAID. Los efectos confusos de los cambios en la demografía de los pacientes, el aumento de las tasas de vacunación y la mejora del tratamiento a lo largo del tiempo se abordan incluyendo la demografía y la fecha del caso como entradas independientes al modelo de red neuronal. El modelo resultante puede interpretarse para identificar mutaciones virales potencialmente significativas y demuestra ser una herramienta predictiva robusta. Aunque se entrenó con datos de secuencia obtenidos completamente antes de la disponibilidad de datos empíricos para Omicron, el modelo puede predecir el riesgo reducido de enfermedad grave de Omicron, de acuerdo con los datos epidemiológicos y experimentales.