logo móvil
Contáctanos

Sparse-MoE-SAM: Un marco ligero que integra MoE y SAM con un mecanismo de atención dispersa para la segmentación de enfermedades de las plantas en entornos con recursos limitados

Autores: Zhao, Benhan; Kang, Xilin; Zhou, Hao; Shi, Ziyang; Li, Lin; Zhou, Guoxiong; Wan, Fangying; Zhu, Jiangzhang; Yan, Yongming; Li, Leheng; Wu, Yulong

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Botánica

Palabras clave

Segmentación de enfermedades de plantas
Inteligencia artificial
Mecanismos de atención dispersa
Marco de aprendizaje profundo
Errores de segmentación
Complejidad computacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 12

Citaciones: Sin citaciones


Descripción
La segmentación de enfermedades de las plantas ha logrado un progreso significativo con la ayuda de la inteligencia artificial. Sin embargo, implementar modelos de segmentación de alta precisión en entornos con recursos limitados enfrenta tres desafíos clave: (A) Los mecanismos de atención densa tradicionales incurren en un crecimiento cuadrático de la complejidad computacional, lo que los hace inadecuados para hardware de bajo consumo. (B) Las distribuciones espaciales naturalmente dispersas y las variaciones a gran escala en las lesiones de las hojas requieren modelos que capturen simultáneamente dependencias de largo alcance y detalles locales. (C) Los fondos complejos y la iluminación variable en las imágenes de campo a menudo inducen errores de segmentación. Para abordar estos desafíos, proponemos Sparse-MoE-SAM, un marco eficiente basado en un modelo de segmentación mejorado (SAM). Este marco de aprendizaje profundo integra mecanismos de atención dispersa con un decodificador de mezcla de expertos (MoE) de dos etapas. La atención dispersa activa dinámicamente canales clave alineados con los patrones de dispersión de lesiones, reduciendo la complejidad de la auto-atención mientras preserva el contexto de largo alcance. La etapa 1 del decodificador MoE realiza una localización de límites de grano grueso; la etapa 2 logra una segmentación de grano fino aprovechando expertos especializados dentro del MoE, mejorando significativamente la precisión de la discriminación de bordes. El repositorio de expertos, que comprende convoluciones estándar, convoluciones dilatadas y convoluciones separables en profundidad, enruta dinámicamente características a través de rutas de procesamiento optimizadas basadas en la textura de entrada y la morfología de las lesiones. Esto permite una segmentación robusta a través de diversas texturas de hojas y etapas de desarrollo de las plantas. Además, diseñamos un módulo de agrupamiento espacial en pirámide atrous (ASPP) mejorado con atención dispersa para capturar contextos multiescala tanto para lesiones extensas como para manchas pequeñas. Las evaluaciones en tres conjuntos de datos heterogéneos (PlantVillage Extended, CVPPP y nuestras imágenes de campo auto-recolectadas) muestran que Sparse-MoE-SAM logra una media de Intersección sobre Unión (mIoU) del 94.2%, superando al SAM estándar por 2.5 puntos porcentuales, mientras reduce los costos computacionales en un 23.7% en comparación con la línea base del SAM original. El modelo también demuestra un rendimiento equilibrado entre clases de enfermedades y una mejor compatibilidad con el hardware. Nuestro trabajo valida que la integración de atención dispersa con mecanismos de MoE mantiene la precisión mientras reduce drásticamente las demandas computacionales, permitiendo el despliegue escalable de modelos de segmentación de enfermedades de las plantas en dispositivos móviles y de borde.

Otros recursos que podrían interesarte

    Temas Virtualpro