Clustering on dissimilarity representations for detecting mislabelled seismic signals at Nevado del Ruiz Volcano
Agrupación de representaciones de diferencias para detectar señales sísmicas mal etiquetadas en el Volcán Nevado del Ruiz
La clasificación de las señales sísmicas en los volcanes de Colombia ha sido llevada a cabo manualmente mediante inspección visual. Con el fin de reducir la carga de trabajo de los analistas y para tornar la clasificación confiable y objetiva, se ha explorado el uso de algoritmos de aprendizaje supervisado; particularmente, clasificadores construidos en espacios de disimilitud. No obstante, el desempeño de dichos métodos de aprendizaje está sujeto a la disponibilidad de un conjunto de entrenamiento representativo y, a priori, bien clasificado. Para detectar eventos mal clasificados, se propone el uso de técnicas de agrupamiento sobre las representaciones de disimilitud. Los experimentos, realizados sobre las señales sísmicas verificadas, muestran una mejora significativa respecto a las tasas de reconocimiento para los datos originales.
INTRODUCCIÓN
En muchas aplicaciones de reconocimiento de patrones, es extremadamente difícil o costoso, o incluso imposible, etiquetar de forma fiable una muestra de entrenamiento con su verdadera categoría (Jain et al., 2000). En particular, en la clasificación automática de señales sísmico-volcánicas, los horarios de trabajo nocturnos y de turnos rotativos, las evaluaciones tediosas y los cambios de personal hacen que la tarea de reconocimiento por inspección visual sea susceptible de errores humanos. Además, los analistas se enzarzan a menudo en diferencias de opinión sobre las interpretaciones de las señales dudosas.
Para reducir la carga de trabajo del analista sísmico y los riesgos asociados a los juicios subjetivos, se han utilizado varios métodos de clasificación supervisada (Scarpetta et al., 2005; Langer et al., 2006; Orozco-Alzate et al., 2006a). Se supone que para esas técnicas de clasificación supervisada se dispone de un conjunto de datos bien etiquetados. Sin embargo, debido a las mismas razones citadas anteriormente, es muy probable que los conjuntos de entrenamiento incluyan eventos mal etiquetados.
En Langer et al. (2006) se realizó una clasificación automática de los eventos sísmicos del volcán Soufrière Hill. Además, se realizó una cuidadosa revisión manual de la clasificación original a-priori por parte de un experto que no había participado en el etiquetado previo del conjunto de datos. Se descubrió que un número considerable de eventos se atribuían erróneamente a otras clases. Como resultado, se obtuvo una notable mejora en la precisión de la clasificación cuando se utilizó el conjunto de datos revisado.
El volcán Nevado del Ruiz es monitoreado por el Observatorio Vulcanológico y Sismológico de Manizales (VSOM).
Recursos
-
Formatopdf
-
Idioma:inglés
-
Tamaño:370 kb