Con el rápido desarrollo de la inteligencia artificial en los últimos años, la investigación sobre el procesamiento de imágenes, la minería de textos y la informática del genoma se ha profundizado gradualmente, y la minería de bases de datos a gran escala ha comenzado a recibir cada vez más atención. Los objetos de la minería de datos también se han vuelto más complejos, y las dimensiones de los datos de los objetos mineros son cada vez más altas. En comparación con las dimensiones de datos ultra-elevadas, el número de muestras disponibles para el análisis es demasiado pequeño, lo que da lugar a la producción de datos de muestras pequeñas de alta dimensión. Los datos de pequeñas muestras de alta dimensión provocarán graves desastres dimensionales en el proceso de minería. Mediante la selección de características, se pueden eliminar eficazmente las características redundantes y el ruido en los datos de muestras pequeñas de alta dimensión, evitando los desastres dimensionales y mejorando la eficacia real de los algoritmos de minería. Sin embargo, los métodos de selección de características existentes hacen hincapié en el rendimiento de la clasificación o la agrupación de los resultados de la selección de características e ignoran la estabilidad de los resultados de la selección de características, lo que conducirá a resultados de selección de características inestables, y es difícil obtener características reales y comprensibles. Basándose en el método tradicional de selección de características, este artículo propone un método de selección de características de conjunto, el método de selección de características de Bosque de Bits Aleatorio de Clustering Recursivo (RBF-RCE), combinado con múltiples conjuntos de clasificadores básicos para llevar a cabo un aprendizaje paralelo y filtrar los mejores resultados de clasificación de características, optimiza el rendimiento de clasificación de los métodos tradicionales de selección de características, y también puede mejorar la estabilidad de la selección de características. A continuación, este artículo analiza las razones de la inestabilidad de la selección de características e introduce un método de medición de la estabilidad de la selección de características, la Medición de Intersección (IM), para evaluar si el proceso de selección de características es estable. La eficacia del método propuesto se verifica mediante experimentos en varios grupos de conjuntos de datos de muestras pequeñas de alta dimensión.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Desmezcla de la actividad cerebral oscilatoria mediante la localización de la fuente del EEG y la descomposición modal empírica
Artículo:
Factor de influencia coloidal del biofloculante en la coagulación del cromo y el nitrobenceno
Artículo:
Desarrollo de tres ensayos de PCR en tiempo real para detectar Bacillus anthracis y evaluación de la utilidad diagnóstica
Artículo:
Inmovilización de mioglobina en membranas compuestas de alginato sódico
Artículo:
Funciones Difusas - y Funciones Difusas Completamente - a través de Conjuntos Difusos e-Abiertos.
Informe, reporte:
Diagnóstico sobre la logística del comercio internacional y su incidencia en la competitividad de las exportaciones de los países miembros
Infografía:
Sistemas de calidad. Six Sigma
Manual:
Química de los taninos
Artículo:
Influencia del COVID-19 en las dinámicas de exportación, producción y consumo de carne vacuna en Colombia y el mundo: Una revisión monográfica.