Detección de silbidos de delfines en tiempo real en Raspberry Pi Zero 2 W con una red neuronal convolucional TFLite
Autores: De Marco, Rocco; Di Nardo, Francesco; Rongoni, Alessandro; Screpanti, Laura; Scaradozzi, David
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 12
Citaciones: Sin citaciones
El conflicto creciente entre los cetáceos y la pesca subraya la necesidad de estrategias de mitigación eficientes que equilibren las prioridades de conservación con la viabilidad económica. Este estudio presenta un enfoque impulsado por TinyML que despliega una Red Neuronal Convolucional (CNN) optimizada en un Raspberry Pi Zero 2 W para la detección en tiempo real de los silbidos de los delfines mulares, aprovechando el análisis de espectrogramas para abordar los desafíos de monitoreo acústico. Específicamente, un modelo de CNN previamente desarrollado para clasificar las vocalizaciones de los delfines y originalmente implementado con TensorFlow fue convertido a TensorFlow Lite (TFLite) con optimizaciones arquitectónicas, reduciendo el tamaño del modelo en un 76%. Tanto los modelos de TensorFlow como los de TFLite fueron entrenados con 22 horas de grabaciones submarinas tomadas en entornos controlados y procesadas en segmentos de espectrograma de 0.8 s (300 x 150 píxeles). A pesar de la reducción del tamaño del modelo, los modelos de TFLite mantuvieron la misma precisión que el modelo original de TensorFlow (87.8% frente a 87.0%). Se evaluaron el rendimiento y la latencia variando la asignación de hilos (1-8 hilos), revelando el mejor rendimiento con 4 hilos (alineación de cuatro núcleos), logrando una latencia de inferencia de 120 ms y un rendimiento sostenido de 8 espectrogramas/segundo. El sistema demostró robustez en 120 horas de pruebas de estrés continuas sin fallos, subrayando su fiabilidad en entornos marinos. Este trabajo logró un equilibrio crítico entre la eficiencia computacional y la fidelidad de detección (F1-score: 86.9%) aprovechando la inferencia cuantificada y multihilo. Estos avances permiten dispositivos de bajo costo para la detección en tiempo real de la presencia de cetáceos, ofreciendo un potencial transformador para la reducción de captura incidental y sistemas de disuasión adaptativa. Este estudio une la innovación en inteligencia artificial con la gestión ecológica, proporcionando un marco escalable para implementar el aprendizaje automático en entornos con recursos limitados mientras se abordan desafíos urgentes de conservación.
Descripción
El conflicto creciente entre los cetáceos y la pesca subraya la necesidad de estrategias de mitigación eficientes que equilibren las prioridades de conservación con la viabilidad económica. Este estudio presenta un enfoque impulsado por TinyML que despliega una Red Neuronal Convolucional (CNN) optimizada en un Raspberry Pi Zero 2 W para la detección en tiempo real de los silbidos de los delfines mulares, aprovechando el análisis de espectrogramas para abordar los desafíos de monitoreo acústico. Específicamente, un modelo de CNN previamente desarrollado para clasificar las vocalizaciones de los delfines y originalmente implementado con TensorFlow fue convertido a TensorFlow Lite (TFLite) con optimizaciones arquitectónicas, reduciendo el tamaño del modelo en un 76%. Tanto los modelos de TensorFlow como los de TFLite fueron entrenados con 22 horas de grabaciones submarinas tomadas en entornos controlados y procesadas en segmentos de espectrograma de 0.8 s (300 x 150 píxeles). A pesar de la reducción del tamaño del modelo, los modelos de TFLite mantuvieron la misma precisión que el modelo original de TensorFlow (87.8% frente a 87.0%). Se evaluaron el rendimiento y la latencia variando la asignación de hilos (1-8 hilos), revelando el mejor rendimiento con 4 hilos (alineación de cuatro núcleos), logrando una latencia de inferencia de 120 ms y un rendimiento sostenido de 8 espectrogramas/segundo. El sistema demostró robustez en 120 horas de pruebas de estrés continuas sin fallos, subrayando su fiabilidad en entornos marinos. Este trabajo logró un equilibrio crítico entre la eficiencia computacional y la fidelidad de detección (F1-score: 86.9%) aprovechando la inferencia cuantificada y multihilo. Estos avances permiten dispositivos de bajo costo para la detección en tiempo real de la presencia de cetáceos, ofreciendo un potencial transformador para la reducción de captura incidental y sistemas de disuasión adaptativa. Este estudio une la innovación en inteligencia artificial con la gestión ecológica, proporcionando un marco escalable para implementar el aprendizaje automático en entornos con recursos limitados mientras se abordan desafíos urgentes de conservación.