Selección Genómica para la Calidad de Uso Final y Rasgos de Procesamiento en un Programa de Mejora de Trigo Blanco Suave de Invierno con Modelos de Aprendizaje Automático y Aprendizaje Profundo
Autores: Sandhu, Karansher Singh; Aoun, Meriem; Morris, Craig F.; Carter, Arron H.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
Categoría
Ciencias Naturales y Subdisciplinas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 12
Citaciones: Sin citaciones
La cría para el rendimiento de grano, la resistencia a estrés biótico y abiótico, y la calidad de uso final son objetivos importantes de los programas de mejoramiento de trigo. La evaluación de los rasgos de calidad de uso final suele ser secundaria al rendimiento de grano debido a las altas necesidades laborales, el costo de las pruebas y los grandes requisitos de semillas para la fenotipificación. La selección genómica proporciona una alternativa para predecir el rendimiento utilizando marcadores genómicos en predicciones hacia adelante y entre ubicaciones, donde se puede utilizar el conjunto de datos del año anterior para construir los modelos. Debido a los grandes conjuntos de datos en los programas de mejoramiento, exploramos el potencial de los modelos de aprendizaje automático y profundo para predecir catorce rasgos de calidad de uso final en un programa de mejoramiento de trigo de invierno. La población utilizada consistió en 666 genotipos de trigo evaluados durante cinco años (2015-19) en dos ubicaciones (Pullman y Lind, WA, EE. UU.). Se exploraron nueve modelos diferentes, incluidos dos de aprendizaje automático (bosque aleatorio y máquina de soporte vectorial) y dos modelos de aprendizaje profundo (red neuronal convolucional y perceptrón multicapa) para la validación cruzada, predicciones hacia adelante y entre ubicaciones. Las precisiones de predicción para diferentes rasgos variaron de 0.45-0.81, 0.29-0.55 y 0.27-0.50 bajo validación cruzada, predicciones hacia adelante y entre ubicaciones. En general, las precisiones de predicción hacia adelante siguieron aumentando con el tiempo debido a los incrementos en el tamaño de los datos de entrenamiento y fue más evidente para los modelos de aprendizaje automático y profundo. Los modelos de aprendizaje profundo fueron superiores a la mejor predicción lineal no sesgada de regresión de cresta (RRBLUP) y a los modelos bayesianos en todos los escenarios de predicción. La alta precisión observada para los rasgos de calidad de uso final en este estudio apoya su predicción en generaciones tempranas, lo que lleva al avance de genotipos superiores hacia ensayos de rendimiento de grano más extensos. Además, el rendimiento superior de los modelos de aprendizaje automático y profundo refuerza la idea de incluirlos en programas de mejoramiento a gran escala para predecir rasgos complejos.
Descripción
La cría para el rendimiento de grano, la resistencia a estrés biótico y abiótico, y la calidad de uso final son objetivos importantes de los programas de mejoramiento de trigo. La evaluación de los rasgos de calidad de uso final suele ser secundaria al rendimiento de grano debido a las altas necesidades laborales, el costo de las pruebas y los grandes requisitos de semillas para la fenotipificación. La selección genómica proporciona una alternativa para predecir el rendimiento utilizando marcadores genómicos en predicciones hacia adelante y entre ubicaciones, donde se puede utilizar el conjunto de datos del año anterior para construir los modelos. Debido a los grandes conjuntos de datos en los programas de mejoramiento, exploramos el potencial de los modelos de aprendizaje automático y profundo para predecir catorce rasgos de calidad de uso final en un programa de mejoramiento de trigo de invierno. La población utilizada consistió en 666 genotipos de trigo evaluados durante cinco años (2015-19) en dos ubicaciones (Pullman y Lind, WA, EE. UU.). Se exploraron nueve modelos diferentes, incluidos dos de aprendizaje automático (bosque aleatorio y máquina de soporte vectorial) y dos modelos de aprendizaje profundo (red neuronal convolucional y perceptrón multicapa) para la validación cruzada, predicciones hacia adelante y entre ubicaciones. Las precisiones de predicción para diferentes rasgos variaron de 0.45-0.81, 0.29-0.55 y 0.27-0.50 bajo validación cruzada, predicciones hacia adelante y entre ubicaciones. En general, las precisiones de predicción hacia adelante siguieron aumentando con el tiempo debido a los incrementos en el tamaño de los datos de entrenamiento y fue más evidente para los modelos de aprendizaje automático y profundo. Los modelos de aprendizaje profundo fueron superiores a la mejor predicción lineal no sesgada de regresión de cresta (RRBLUP) y a los modelos bayesianos en todos los escenarios de predicción. La alta precisión observada para los rasgos de calidad de uso final en este estudio apoya su predicción en generaciones tempranas, lo que lleva al avance de genotipos superiores hacia ensayos de rendimiento de grano más extensos. Además, el rendimiento superior de los modelos de aprendizaje automático y profundo refuerza la idea de incluirlos en programas de mejoramiento a gran escala para predecir rasgos complejos.