Identificación de la esclerosis sistémica a través de algoritmos de aprendizaje automático y expresión génica
Autores: Alfonso Perez, Gerardo; Castillo, Raquel
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Enfermedad autoinmune
Enfermedad crónica
Genética
Factores ambientales
Enfermedad pulmonar intersticial
Datos de expresión génica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
La esclerosis sistémica (SSc) es una enfermedad autoinmune crónica que sigue sin ser bien comprendida. Se cree que la causa de la enfermedad es una combinación de factores genéticos y ambientales. La evolución de la enfermedad también varía mucho de un paciente a otro. Una complicación común de la enfermedad, con una mayor mortalidad asociada, es la enfermedad pulmonar intersticial (ILD). Presentamos en este documento un algoritmo (utilizando técnicas de aprendizaje automático) que es capaz de identificar, con un 92.2% de precisión, a pacientes que sufren de ILD-SSc utilizando datos de expresión génica obtenidos de sangre periférica. Los datos fueron obtenidos de fuentes públicas (acceso GEO GSE181228) y contienen datos genéticos de 134 pacientes en una etapa inicial, así como en una fecha de seguimiento (12 meses después) para 98 de estos pacientes. Además, hay 45 casos de control (sanos). El algoritmo también identificó 172 genes que podrían estar involucrados en la enfermedad. Estos 172 genes aparecieron en todos los 20 modelos de clasificación más precisos entre un total de medio millón de modelos estimados. Su frecuencia podría sugerir que están relacionados con la enfermedad en cierto grado. El algoritmo propuesto, además de diferenciar entre controles y pacientes, también fue capaz de distinguir entre diferentes variantes de la enfermedad (variantes difusas). Esto puede tener una importancia desde el punto de vista del tratamiento. Los diferentes tipos de variantes tienen un pronóstico asociado diferente.
Descripción
La esclerosis sistémica (SSc) es una enfermedad autoinmune crónica que sigue sin ser bien comprendida. Se cree que la causa de la enfermedad es una combinación de factores genéticos y ambientales. La evolución de la enfermedad también varía mucho de un paciente a otro. Una complicación común de la enfermedad, con una mayor mortalidad asociada, es la enfermedad pulmonar intersticial (ILD). Presentamos en este documento un algoritmo (utilizando técnicas de aprendizaje automático) que es capaz de identificar, con un 92.2% de precisión, a pacientes que sufren de ILD-SSc utilizando datos de expresión génica obtenidos de sangre periférica. Los datos fueron obtenidos de fuentes públicas (acceso GEO GSE181228) y contienen datos genéticos de 134 pacientes en una etapa inicial, así como en una fecha de seguimiento (12 meses después) para 98 de estos pacientes. Además, hay 45 casos de control (sanos). El algoritmo también identificó 172 genes que podrían estar involucrados en la enfermedad. Estos 172 genes aparecieron en todos los 20 modelos de clasificación más precisos entre un total de medio millón de modelos estimados. Su frecuencia podría sugerir que están relacionados con la enfermedad en cierto grado. El algoritmo propuesto, además de diferenciar entre controles y pacientes, también fue capaz de distinguir entre diferentes variantes de la enfermedad (variantes difusas). Esto puede tener una importancia desde el punto de vista del tratamiento. Los diferentes tipos de variantes tienen un pronóstico asociado diferente.