Biblioteca93.141 documentos en línea

Artículo

An Overview of Supervised Machine Learning Methods and Data Analysis for COVID-19 DetectionVisión general de los métodos de aprendizaje automático supervisado y análisis de datos para la detección de COVID-19

Resumen

Antecedentes y objetivo. Para mitigar la propagación del virus responsable del COVID-19, conocido como SARS-CoV-2, urge realizar pruebas masivas en la población. Debido a la constante escasez de reactivos para las pruebas de PCR (reacción en cadena de la polimerasa), que son las pruebas por excelencia para COVID-19, varios centros médicos han optado por pruebas inmunológicas para buscar la presencia de anticuerpos producidos contra este virus. Sin embargo, estas pruebas presentan una elevada tasa de falsos positivos (resultados positivos pero en realidad negativos) y falsos negativos (resultados negativos pero en realidad positivos), por lo que no siempre son fiables. En este trabajo, proponemos una solución basada en Análisis de Datos y Aprendizaje Automático para detectar infecciones por COVID-19. Métodos. Nuestro algoritmo de análisis y aprendizaje automático se basa en los dos conjuntos de datos clínicos más citados de la literatura: uno del Hospital San Raffaele de Milán (Italia) y el otro del Hospital Israelita Albert Einstein de São Paulo (Brasilia). Los conjuntos de datos se procesaron para seleccionar las mejores características que más influyen en el objetivo, y resultó que casi todas ellas son parámetros sanguíneos. Se aplicaron métodos EDA (Exploratory Data Analysis) a los conjuntos de datos y se realizó un estudio comparativo de modelos de aprendizaje automático supervisado, tras el cual se seleccionó la máquina de vectores soporte (SVM) como la de mejor rendimiento. Resultados. El algoritmo de aprendizaje automático supervisado propuesto es SVM. Se obtuvo una precisión del 99,29%, una sensibilidad del 92,79% y una especificidad del 100% con el conjunto de datos de Kaggle (https://www.kaggle.com/einsteindata4u/covid19) tras aplicar la optimización a la SVM. El mismo procedimiento y trabajo se realizaron con el conjunto de datos tomado del Hospital San Raffaele (https://zenodo.org/record/3886927#.YIluB5AzbMV). Una vez más, la SVM presentó el mejor rendimiento entre los demás algoritmos de aprendizaje automático, y se obtuvieron un 92,86%, un 93,55% y un 90,91 de precisión, sensibilidad y especificidad, respectivamente. Conclusiones. Los resultados obtenidos, cuando se comparan con otros de la literatura basados en estos mismos conjuntos de datos, son superiores, lo que nos lleva a concluir que nuestra solución propuesta es fiable para el diagnóstico de COVID-19.

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento