Sparse-MoE-SAM: Un marco ligero que integra MoE y SAM con un mecanismo de atención dispersa para la segmentación de enfermedades de las plantas en entornos con recursos limitados
Autores: Zhao, Benhan; Kang, Xilin; Zhou, Hao; Shi, Ziyang; Li, Lin; Zhou, Guoxiong; Wan, Fangying; Zhu, Jiangzhang; Yan, Yongming; Li, Leheng; Wu, Yulong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Segmentación de enfermedades de plantas
Inteligencia artificial
Mecanismos de atención dispersa
Marco de aprendizaje profundo
Errores de segmentación
Complejidad computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 12
Citaciones: Sin citaciones
La segmentación de enfermedades de las plantas ha logrado un progreso significativo con la ayuda de la inteligencia artificial. Sin embargo, implementar modelos de segmentación de alta precisión en entornos con recursos limitados enfrenta tres desafíos clave: (A) Los mecanismos de atención densa tradicionales incurren en un crecimiento cuadrático de la complejidad computacional, lo que los hace inadecuados para hardware de bajo consumo. (B) Las distribuciones espaciales naturalmente dispersas y las variaciones a gran escala en las lesiones de las hojas requieren modelos que capturen simultáneamente dependencias de largo alcance y detalles locales. (C) Los fondos complejos y la iluminación variable en las imágenes de campo a menudo inducen errores de segmentación. Para abordar estos desafíos, proponemos Sparse-MoE-SAM, un marco eficiente basado en un modelo de segmentación mejorado (SAM). Este marco de aprendizaje profundo integra mecanismos de atención dispersa con un decodificador de mezcla de expertos (MoE) de dos etapas. La atención dispersa activa dinámicamente canales clave alineados con los patrones de dispersión de lesiones, reduciendo la complejidad de la auto-atención mientras preserva el contexto de largo alcance. La etapa 1 del decodificador MoE realiza una localización de límites de grano grueso; la etapa 2 logra una segmentación de grano fino aprovechando expertos especializados dentro del MoE, mejorando significativamente la precisión de la discriminación de bordes. El repositorio de expertos, que comprende convoluciones estándar, convoluciones dilatadas y convoluciones separables en profundidad, enruta dinámicamente características a través de rutas de procesamiento optimizadas basadas en la textura de entrada y la morfología de las lesiones. Esto permite una segmentación robusta a través de diversas texturas de hojas y etapas de desarrollo de las plantas. Además, diseñamos un módulo de agrupamiento espacial en pirámide atrous (ASPP) mejorado con atención dispersa para capturar contextos multiescala tanto para lesiones extensas como para manchas pequeñas. Las evaluaciones en tres conjuntos de datos heterogéneos (PlantVillage Extended, CVPPP y nuestras imágenes de campo auto-recolectadas) muestran que Sparse-MoE-SAM logra una media de Intersección sobre Unión (mIoU) del 94.2%, superando al SAM estándar por 2.5 puntos porcentuales, mientras reduce los costos computacionales en un 23.7% en comparación con la línea base del SAM original. El modelo también demuestra un rendimiento equilibrado entre clases de enfermedades y una mejor compatibilidad con el hardware. Nuestro trabajo valida que la integración de atención dispersa con mecanismos de MoE mantiene la precisión mientras reduce drásticamente las demandas computacionales, permitiendo el despliegue escalable de modelos de segmentación de enfermedades de las plantas en dispositivos móviles y de borde.
Descripción
La segmentación de enfermedades de las plantas ha logrado un progreso significativo con la ayuda de la inteligencia artificial. Sin embargo, implementar modelos de segmentación de alta precisión en entornos con recursos limitados enfrenta tres desafíos clave: (A) Los mecanismos de atención densa tradicionales incurren en un crecimiento cuadrático de la complejidad computacional, lo que los hace inadecuados para hardware de bajo consumo. (B) Las distribuciones espaciales naturalmente dispersas y las variaciones a gran escala en las lesiones de las hojas requieren modelos que capturen simultáneamente dependencias de largo alcance y detalles locales. (C) Los fondos complejos y la iluminación variable en las imágenes de campo a menudo inducen errores de segmentación. Para abordar estos desafíos, proponemos Sparse-MoE-SAM, un marco eficiente basado en un modelo de segmentación mejorado (SAM). Este marco de aprendizaje profundo integra mecanismos de atención dispersa con un decodificador de mezcla de expertos (MoE) de dos etapas. La atención dispersa activa dinámicamente canales clave alineados con los patrones de dispersión de lesiones, reduciendo la complejidad de la auto-atención mientras preserva el contexto de largo alcance. La etapa 1 del decodificador MoE realiza una localización de límites de grano grueso; la etapa 2 logra una segmentación de grano fino aprovechando expertos especializados dentro del MoE, mejorando significativamente la precisión de la discriminación de bordes. El repositorio de expertos, que comprende convoluciones estándar, convoluciones dilatadas y convoluciones separables en profundidad, enruta dinámicamente características a través de rutas de procesamiento optimizadas basadas en la textura de entrada y la morfología de las lesiones. Esto permite una segmentación robusta a través de diversas texturas de hojas y etapas de desarrollo de las plantas. Además, diseñamos un módulo de agrupamiento espacial en pirámide atrous (ASPP) mejorado con atención dispersa para capturar contextos multiescala tanto para lesiones extensas como para manchas pequeñas. Las evaluaciones en tres conjuntos de datos heterogéneos (PlantVillage Extended, CVPPP y nuestras imágenes de campo auto-recolectadas) muestran que Sparse-MoE-SAM logra una media de Intersección sobre Unión (mIoU) del 94.2%, superando al SAM estándar por 2.5 puntos porcentuales, mientras reduce los costos computacionales en un 23.7% en comparación con la línea base del SAM original. El modelo también demuestra un rendimiento equilibrado entre clases de enfermedades y una mejor compatibilidad con el hardware. Nuestro trabajo valida que la integración de atención dispersa con mecanismos de MoE mantiene la precisión mientras reduce drásticamente las demandas computacionales, permitiendo el despliegue escalable de modelos de segmentación de enfermedades de las plantas en dispositivos móviles y de borde.