Mejorando la Predicción Genómica con Aprendizaje Automático Incorporando TPE para la Optimización de Hiperparámetros
Autores: Liang, Mang; An, Bingxing; Li, Keanning; Du, Lili; Deng, Tianyu; Cao, Sheng; Du, Yueying; Xu, Lingyang; Gao, Xue; Zhang, Lupei; Li, Junya; Gao, Huijiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 9
Citaciones: Sin citaciones
Dependiendo de una excelente capacidad de predicción, el aprendizaje automático ha sido considerado el implemento más poderoso para analizar datos genómicos de secuenciación de alto rendimiento. Sin embargo, el sofisticado proceso de ajuste de hiperparámetros dificulta enormemente la aplicación más amplia del aprendizaje automático en programas de cría de animales y plantas. Por lo tanto, integramos un algoritmo de ajuste automático de hiperparámetros, el estimador de Parzen estructurado en árbol (TPE), con el aprendizaje automático para simplificar el proceso de uso del aprendizaje automático para la predicción genómica. En este estudio, aplicamos TPE para optimizar los hiperparámetros de la regresión de cresta de núcleo (KRR) y la regresión de vectores de soporte (SVR). Para evaluar el rendimiento de TPE, comparamos la precisión de predicción de KRR-TPE y SVR-TPE con la mejor predicción lineal no sesgada genómica (GBLUP) y KRR-RS, KRR-Grid, SVR-RS y SVR-Grid, que ajustaron los hiperparámetros de KRR y SVR utilizando búsqueda aleatoria (RS) y búsqueda en cuadrícula (Grid) en un conjunto de datos de simulación y en los conjuntos de datos reales. Los resultados indicaron que KRR-TPE logró la capacidad de predicción más poderosa considerando todas las poblaciones y fue el más conveniente. Especialmente para las poblaciones de ganado de carne Simmental chino y pino Loblolly, la precisión de predicción de KRR-TPE tuvo una mejora promedio del 8.73% y 6.08% en comparación con GBLUP, respectivamente. Nuestro estudio promoverá en gran medida la aplicación del aprendizaje automático en GP y acelerará aún más el progreso en la cría.
Descripción
Dependiendo de una excelente capacidad de predicción, el aprendizaje automático ha sido considerado el implemento más poderoso para analizar datos genómicos de secuenciación de alto rendimiento. Sin embargo, el sofisticado proceso de ajuste de hiperparámetros dificulta enormemente la aplicación más amplia del aprendizaje automático en programas de cría de animales y plantas. Por lo tanto, integramos un algoritmo de ajuste automático de hiperparámetros, el estimador de Parzen estructurado en árbol (TPE), con el aprendizaje automático para simplificar el proceso de uso del aprendizaje automático para la predicción genómica. En este estudio, aplicamos TPE para optimizar los hiperparámetros de la regresión de cresta de núcleo (KRR) y la regresión de vectores de soporte (SVR). Para evaluar el rendimiento de TPE, comparamos la precisión de predicción de KRR-TPE y SVR-TPE con la mejor predicción lineal no sesgada genómica (GBLUP) y KRR-RS, KRR-Grid, SVR-RS y SVR-Grid, que ajustaron los hiperparámetros de KRR y SVR utilizando búsqueda aleatoria (RS) y búsqueda en cuadrícula (Grid) en un conjunto de datos de simulación y en los conjuntos de datos reales. Los resultados indicaron que KRR-TPE logró la capacidad de predicción más poderosa considerando todas las poblaciones y fue el más conveniente. Especialmente para las poblaciones de ganado de carne Simmental chino y pino Loblolly, la precisión de predicción de KRR-TPE tuvo una mejora promedio del 8.73% y 6.08% en comparación con GBLUP, respectivamente. Nuestro estudio promoverá en gran medida la aplicación del aprendizaje automático en GP y acelerará aún más el progreso en la cría.