Biblioteca93.141 documentos en línea

Artículo

Influence of Data Splitting on Performance of Machine Learning Models in Prediction of Shear Strength of SoilInfluencia de la división de datos en el rendimiento de los modelos de aprendizaje automático en la predicción de la resistencia al corte del suelo

Resumen

El objetivo principal de este estudio es evaluar y comparar el rendimiento de diferentes algoritmos de aprendizaje automtico (ML), a saber, algoritmos de redes neuronales artificiales (RNA), mquinas de aprendizaje extremo (ELM) y rboles de refuerzo (Boosted), teniendo en cuenta la influencia de diversas relaciones entre entrenamiento y prueba en la prediccin de la resistencia al corte del suelo, una de las propiedades de ingeniera geotcnica ms crticas en el diseo y la construccin de obras de ingeniera civil. Para ello, se utiliz una base de datos de 538 muestras de suelo recogidas en el proyecto de la central elctrica de Long Phu 1, en Vietnam, con el fin de generar los conjuntos de datos para el proceso de modelado. Se utilizaron diferentes proporciones (10/90, 20/80, 30/70, 40/60, 50/50, 60/40, 70/30, 80/20 y 90/10) para dividir los conjuntos de datos en conjuntos de datos de entrenamiento y de prueba para la evaluacin del rendimiento de los modelos. Se emplearon indicadores estadsticos populares, como el error cuadrtico medio (RMSE), el error absoluto medio (MAE) y el coeficiente de correlacin (), para evaluar la capacidad de prediccin de los modelos en diferentes proporciones de entrenamiento y prueba. Adems, se realiz simultneamente una simulacin Monte Carlo para evaluar el rendimiento de los modelos propuestos, teniendo en cuenta el efecto de muestreo aleatorio. Los resultados mostraron que, aunque los tres modelos ML funcionaron bien, la RNA fue el modelo ms preciso y estadsticamente estable despus de 1000 simulaciones Monte Carlo (Media =0,9348) en comparacin con otros modelos como Boosted (Media =0,9192) y ELM (Media =0,8703). La investigacin sobre el rendimiento de los modelos mostr que la capacidad predictiva de los modelos ML se vea muy afectada por las proporciones de entrenamiento/prueba, donde la de 70/30 presentaba el mejor rendimiento de los modelos. En resumen, los resultados presentados aqu mostraron una manera eficaz en la seleccin de las proporciones adecuadas de conjuntos de datos y el mejor modelo ML para predecir la resistencia al corte del suelo con precisin, lo que sera til en las fases de diseo e ingeniera de proyectos de construccin.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento