Biblioteca93.141 documentos en línea

Artículo

Feature Selection and Feature Stability Measurement Method for High-Dimensional Small Sample Data Based on Big Data TechnologyMétodo de selección de características y medición de la estabilidad de las características para datos de muestras pequeñas de alta dimensión basados en la tecnología de Big Data

Resumen

Con el rápido desarrollo de la inteligencia artificial en los últimos años, la investigación sobre el procesamiento de imágenes, la minería de textos y la informática del genoma se ha profundizado gradualmente, y la minería de bases de datos a gran escala ha comenzado a recibir cada vez más atención. Los objetos de la minería de datos también se han vuelto más complejos, y las dimensiones de los datos de los objetos mineros son cada vez más altas. En comparación con las dimensiones de datos ultra-elevadas, el número de muestras disponibles para el análisis es demasiado pequeño, lo que da lugar a la producción de datos de muestras pequeñas de alta dimensión. Los datos de pequeñas muestras de alta dimensión provocarán graves desastres dimensionales en el proceso de minería. Mediante la selección de características, se pueden eliminar eficazmente las características redundantes y el ruido en los datos de muestras pequeñas de alta dimensión, evitando los desastres dimensionales y mejorando la eficacia real de los algoritmos de minería. Sin embargo, los métodos de selección de características existentes hacen hincapié en el rendimiento de la clasificación o la agrupación de los resultados de la selección de características e ignoran la estabilidad de los resultados de la selección de características, lo que conducirá a resultados de selección de características inestables, y es difícil obtener características reales y comprensibles. Basándose en el método tradicional de selección de características, este artículo propone un método de selección de características de conjunto, el método de selección de características de Bosque de Bits Aleatorio de Clustering Recursivo (RBF-RCE), combinado con múltiples conjuntos de clasificadores básicos para llevar a cabo un aprendizaje paralelo y filtrar los mejores resultados de clasificación de características, optimiza el rendimiento de clasificación de los métodos tradicionales de selección de características, y también puede mejorar la estabilidad de la selección de características. A continuación, este artículo analiza las razones de la inestabilidad de la selección de características e introduce un método de medición de la estabilidad de la selección de características, la Medición de Intersección (IM), para evaluar si el proceso de selección de características es estable. La eficacia del método propuesto se verifica mediante experimentos en varios grupos de conjuntos de datos de muestras pequeñas de alta dimensión.

  • Tipo de documento:
  • Formato:pdf
  • Idioma:Inglés
  • Tamaño: Kb

Cómo citar el documento

Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.

Este contenido no est� disponible para su tipo de suscripci�n

Información del documento