logo móvil
Contáctanos

Detección de silbidos de delfines en tiempo real en Raspberry Pi Zero 2 W con una red neuronal convolucional TFLite

Autores: De Marco, Rocco; Di Nardo, Francesco; Rongoni, Alessandro; Screpanti, Laura; Scaradozzi, David

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico


Categoría

Ingeniería y Tecnología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 12

Citaciones: Sin citaciones


Descripción
El conflicto creciente entre los cetáceos y la pesca subraya la necesidad de estrategias de mitigación eficientes que equilibren las prioridades de conservación con la viabilidad económica. Este estudio presenta un enfoque impulsado por TinyML que despliega una Red Neuronal Convolucional (CNN) optimizada en un Raspberry Pi Zero 2 W para la detección en tiempo real de los silbidos de los delfines mulares, aprovechando el análisis de espectrogramas para abordar los desafíos de monitoreo acústico. Específicamente, un modelo de CNN previamente desarrollado para clasificar las vocalizaciones de los delfines y originalmente implementado con TensorFlow fue convertido a TensorFlow Lite (TFLite) con optimizaciones arquitectónicas, reduciendo el tamaño del modelo en un 76%. Tanto los modelos de TensorFlow como los de TFLite fueron entrenados con 22 horas de grabaciones submarinas tomadas en entornos controlados y procesadas en segmentos de espectrograma de 0.8 s (300 x 150 píxeles). A pesar de la reducción del tamaño del modelo, los modelos de TFLite mantuvieron la misma precisión que el modelo original de TensorFlow (87.8% frente a 87.0%). Se evaluaron el rendimiento y la latencia variando la asignación de hilos (1-8 hilos), revelando el mejor rendimiento con 4 hilos (alineación de cuatro núcleos), logrando una latencia de inferencia de 120 ms y un rendimiento sostenido de 8 espectrogramas/segundo. El sistema demostró robustez en 120 horas de pruebas de estrés continuas sin fallos, subrayando su fiabilidad en entornos marinos. Este trabajo logró un equilibrio crítico entre la eficiencia computacional y la fidelidad de detección (F1-score: 86.9%) aprovechando la inferencia cuantificada y multihilo. Estos avances permiten dispositivos de bajo costo para la detección en tiempo real de la presencia de cetáceos, ofreciendo un potencial transformador para la reducción de captura incidental y sistemas de disuasión adaptativa. Este estudio une la innovación en inteligencia artificial con la gestión ecológica, proporcionando un marco escalable para implementar el aprendizaje automático en entornos con recursos limitados mientras se abordan desafíos urgentes de conservación.

Documentos Relacionados

Temas Virtualpro