Modelado funcional de datos de alta dimensionalidad: un enfoque de aprendizaje de variedades
Autores: Hernández-Roig, Harold A.; Aguilera-Morillo, M. Carmen; Lillo, Rosa E.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
Categoría
Matemáticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Este documento presenta (ML-stringing), una alternativa al stringing original basado en Escalamiento Unidimensional (UDS). Nuestra propuesta se enmarca dentro de una clase más amplia de métodos que mapean observaciones de alta dimensión al espacio infinito de funciones, permitiendo el uso de (FDA). El stringing maneja datos generales de alta dimensión como realizaciones mezcladas de un proceso estocástico desconocido. Por lo tanto, la característica esencial del método es una reorganización de los valores observados. Motivados por la naturaleza lineal de UDS y el creciente número de aplicaciones a las ciencias biológicas (por ejemplo, modelado funcional de matrices de expresión génica y polimorfismos de nucleótido único, o la clasificación de neuroimágenes) nuestro objetivo es recuperar relaciones más complejas entre predictores a través de ML. En estudios de simulación, se muestra que ML-stringing logra ordenamientos de mayor calidad y que, en general, esto conduce a mejoras en la representación funcional y modelado de los datos. La versatilidad de nuestro método también se ilustra con una aplicación a un estudio de cáncer de colon que trata con matrices de expresión génica de alta dimensión. Este documento muestra que ML-stringing es una alternativa factible a la versión basada en UDS. Además, abre una ventana a nuevas contribuciones al campo de FDA y al estudio de datos de alta dimensión.
Descripción
Este documento presenta (ML-stringing), una alternativa al stringing original basado en Escalamiento Unidimensional (UDS). Nuestra propuesta se enmarca dentro de una clase más amplia de métodos que mapean observaciones de alta dimensión al espacio infinito de funciones, permitiendo el uso de (FDA). El stringing maneja datos generales de alta dimensión como realizaciones mezcladas de un proceso estocástico desconocido. Por lo tanto, la característica esencial del método es una reorganización de los valores observados. Motivados por la naturaleza lineal de UDS y el creciente número de aplicaciones a las ciencias biológicas (por ejemplo, modelado funcional de matrices de expresión génica y polimorfismos de nucleótido único, o la clasificación de neuroimágenes) nuestro objetivo es recuperar relaciones más complejas entre predictores a través de ML. En estudios de simulación, se muestra que ML-stringing logra ordenamientos de mayor calidad y que, en general, esto conduce a mejoras en la representación funcional y modelado de los datos. La versatilidad de nuestro método también se ilustra con una aplicación a un estudio de cáncer de colon que trata con matrices de expresión génica de alta dimensión. Este documento muestra que ML-stringing es una alternativa factible a la versión basada en UDS. Además, abre una ventana a nuevas contribuciones al campo de FDA y al estudio de datos de alta dimensión.