logo móvil
logo tablet

Cookies y Privacidad

Usamos cookies propias y de terceros para mejorar la experiencia de nuestros usuarios, analizar el tráfico del sitio y personalizar contenido. Si continúas navegando, asumimos que aceptas su uso. Para más información, consulta nuestra Política de Cookies

Detección de la retinopatía diabética en imágenes de fondo de ojo mediante modelos de clasificación de CNN

La diabetes es una enfermedad generalizada en el mundo y puede llevar a la retinopatía diabética, edema macular y otras complicaciones microvasculares evidentes en la retina del ojo humano. Este estudio intenta detectar la retinopatía diabética (RD), que ha sido la principal causa de ceguera en las personas en la última década. El tratamiento oportuno o temprano es necesario para prevenir algunas complicaciones de la RD y controlar la glucosa en sangre. La detección de la RD es muy difícil en un diagnóstico manual que consume mucho tiempo debido a su diversidad y complejidad. Este trabajo utiliza una aplicación de aprendizaje profundo, una red neuronal convolucional (CNN), en fotografías de fondo de ojo para distinguir las etapas de la RD. El conjunto de imágenes en este estudio se obtiene del Hospital de Oftalmología Xiangya N.º 2 (XHO), Changsha, China, que es muy grande, pequeño y las etiquetas están desequilibradas. Por lo tanto, este estudio resuelve primero el problema del conjunto de datos existente proponiendo un método que utiliza pasos de preprocesamiento, regularización y aumento para aumentar y preparar el conjunto de imágenes de XHO para el entrenamiento y mejorar el rendimiento. Luego, aprovecha las ventajas del poder de la CNN con diferentes estructuras de red neuronal residual (ResNet), a saber, ResNet-101, ResNet-50 y VggNet-16, para detectar RD en los conjuntos de datos de XHO. ResNet-101 logró el máximo nivel de precisión, 0.9888, con una pérdida de entrenamiento de 0.3499 y una pérdida de prueba de 0.9882. Luego, ResNet-101 se evalúa en 1787 fotos de las bases de datos HRF, STARE, DIARETDB0 y XHO, logrando una precisión promedio de 0.97, que es mayor que los esfuerzos anteriores. Los resultados prueban que el modelo de CNN (ResNet-101) tiene una mejor precisión que ResNet-50 y VggNet-16 en la clasificación de imágenes de RD.

Autores: Asia, Al-Omaisi; Zhu, Cheng-Zhang; Althubiti, Sara A.; Al-Alimi, Dalal; Xiao, Ya-Long; Ouyang, Ping-Bo; Al-Qaness, Mohammed A. A.

Idioma: Inglés

Editor: MDPI

Año: 2022

Disponible con Suscripción Virtualpro

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 10

Citaciones: Sin citaciones


Este documento es un artículo elaborado por Al-Omaisi Asia, Cheng-Zhang Zhu, Sara A. Althubiti, Dalal Al-Alimi, Ya-Long Xiao, Ping-Bo Ouyang y Mohammed A. A. Al-Qaness para la revista Electronics, Vol. 11, Núm. 17. Publicación de MDPI. Contacto: electronics@mdpi.com
Descripción
La diabetes es una enfermedad generalizada en el mundo y puede llevar a la retinopatía diabética, edema macular y otras complicaciones microvasculares evidentes en la retina del ojo humano. Este estudio intenta detectar la retinopatía diabética (RD), que ha sido la principal causa de ceguera en las personas en la última década. El tratamiento oportuno o temprano es necesario para prevenir algunas complicaciones de la RD y controlar la glucosa en sangre. La detección de la RD es muy difícil en un diagnóstico manual que consume mucho tiempo debido a su diversidad y complejidad. Este trabajo utiliza una aplicación de aprendizaje profundo, una red neuronal convolucional (CNN), en fotografías de fondo de ojo para distinguir las etapas de la RD. El conjunto de imágenes en este estudio se obtiene del Hospital de Oftalmología Xiangya N.º 2 (XHO), Changsha, China, que es muy grande, pequeño y las etiquetas están desequilibradas. Por lo tanto, este estudio resuelve primero el problema del conjunto de datos existente proponiendo un método que utiliza pasos de preprocesamiento, regularización y aumento para aumentar y preparar el conjunto de imágenes de XHO para el entrenamiento y mejorar el rendimiento. Luego, aprovecha las ventajas del poder de la CNN con diferentes estructuras de red neuronal residual (ResNet), a saber, ResNet-101, ResNet-50 y VggNet-16, para detectar RD en los conjuntos de datos de XHO. ResNet-101 logró el máximo nivel de precisión, 0.9888, con una pérdida de entrenamiento de 0.3499 y una pérdida de prueba de 0.9882. Luego, ResNet-101 se evalúa en 1787 fotos de las bases de datos HRF, STARE, DIARETDB0 y XHO, logrando una precisión promedio de 0.97, que es mayor que los esfuerzos anteriores. Los resultados prueban que el modelo de CNN (ResNet-101) tiene una mejor precisión que ResNet-50 y VggNet-16 en la clasificación de imágenes de RD.

Documentos Relacionados

Temas Virtualpro