La creciente producción de datos temporales, especialmente de series de tiempo, ha motivado la extracción analítica de conocimiento valioso para comprender fenómenos o para la toma de decisiones. A medida que aumenta la disponibilidad de algoritmos para procesar datos, el problema de elegir el más adecuado se vuelve más frecuente. Este problema se conoce como la Selección del Modelo Completo (SMC), que consiste en encontrar un conjunto apropiado de métodos y la optimización de hiperparámetros para realizar un conjunto de tareas estructuradas como una tubería. Se han propuesto múltiples enfoques (basados en metaheurísticas)para abordar este problema, en los que se construyen tuberías automatizadas para realizar múltiples tareas sin mucha dependencia del conocimiento del usuario. La mayoría de estos enfoques proponen tuberías para procesar datos no temporales. Motivado por esto, este artículo propone una arquitectura para encontrar tuberías optimizadas para tareas de series de tiempo. El algoritmo de micro-Evolución Diferencial (µ-ED, metaheurística basada en población) con diferentes variantes y codificación continua, es comparado contra una búsqueda local (BL, búsqueda de un solo punto) con codificación binaria y mixta. Se realizan múltiples experimentos para analizar el rendimiento de cada enfoque en diez bases de datos de series de tiempo. Los resultados finales sugieren que el enfoque de µ-ED con la variante rand/1/bin es útil para encontrar tuberías competitivas sin sacrificar el rendimiento, mientras que la BL con codificación binaria logra las tasas de error de clasificación incorrecta más bajas, pero tiene el costo computacional más alto durante la etapa de entrenamiento.
INTRODUCCIÓN
En los últimos años, la capacidad de generar y almacenar datos ha superado con creces la capacidad de analizarlos y explotarlos (Rydning 2018). Según Gantza y Reisel (2012), apenas el 3% de los datos mundiales están actualmente etiquetados y listos para su manipulación, y solo el 0,5% de ellos se utiliza para el análisis, al menos en 2012.
Por ello, el interés por analizar y extraer información útil para comprender fenómenos o para la toma de decisiones ha llamado la atención de los profesionales y de la comunidad investigadora. La creciente producción de datos temporales, especialmente series temporales, ha motivado el análisis para extraer conocimiento valioso a través de procesos de descubrimiento de conocimiento en bases de datos (KDD) y técnicas de minería de datos (DM) (Sun, Yang, Liu, Chen, Rao, y Bai 2019, Boulle, Dallas, Nakatsukasa, y Samaddar 2020).
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Vulnerabilidades y limitaciones fundamentales en la gestión de residuos peligrosos y su disposición : una herramienta de evaluación de lista de verificación
Tesis:
Estudio del uso de residuos industriales no peligrosos a través del proceso de compostaje y su aplicación para el cultivo de maíz y frijol
Artículo:
Caracterización de residuos de industrias apícolas para su utilización en la producción de planteles
Artículo:
Estimación de la recarga media anual en los acuíferos de la Sabana de Bogotá
Artículo:
Retos de la implantación de la contabilidad de gestión ambiental y gestión de la cadena de suministro en el sector manufacturero de las economías emergentes.
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Infografía:
Sistemas de calidad. Six Sigma
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.