Métodos mejorados de selección de instancias para la optimización de la velocidad de las máquinas de vectores soporte
Autores: Akinyelu, Andronicus A.; Adewumi, Aderemi O.
Idioma: Inglés
Editor: Hindawi
Año: 2017
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 13
Citaciones: Sin citaciones
La máquina de vectores de soporte (SVM) es una de las principales opciones en tareas relacionadas con el reconocimiento de patrones y clasificación. Se ha utilizado con éxito para clasificar datos linealmente separables y no linealmente separables con alta precisión. Sin embargo, en cuanto a la velocidad de clasificación, las SVM son superadas por muchos algoritmos de aprendizaje automático, especialmente cuando se involucran conjuntos de datos masivos. La velocidad de clasificación de las SVM escala linealmente con el número de vectores de soporte, y los vectores de soporte aumentan con el aumento del tamaño del conjunto de datos. Por lo tanto, la velocidad de clasificación de las SVM puede reducirse enormemente si se entrena con un conjunto de datos reducido. Las técnicas de selección de instancias son una de las técnicas más efectivas para minimizar el tiempo de entrenamiento de las SVM. En este estudio, se proponen dos técnicas de selección de instancias adecuadas para identificar instancias de entrenamiento relevantes. Las técnicas se evalúan en un conjunto de datos que contiene 4000 correos electr
Descripción
La máquina de vectores de soporte (SVM) es una de las principales opciones en tareas relacionadas con el reconocimiento de patrones y clasificación. Se ha utilizado con éxito para clasificar datos linealmente separables y no linealmente separables con alta precisión. Sin embargo, en cuanto a la velocidad de clasificación, las SVM son superadas por muchos algoritmos de aprendizaje automático, especialmente cuando se involucran conjuntos de datos masivos. La velocidad de clasificación de las SVM escala linealmente con el número de vectores de soporte, y los vectores de soporte aumentan con el aumento del tamaño del conjunto de datos. Por lo tanto, la velocidad de clasificación de las SVM puede reducirse enormemente si se entrena con un conjunto de datos reducido. Las técnicas de selección de instancias son una de las técnicas más efectivas para minimizar el tiempo de entrenamiento de las SVM. En este estudio, se proponen dos técnicas de selección de instancias adecuadas para identificar instancias de entrenamiento relevantes. Las técnicas se evalúan en un conjunto de datos que contiene 4000 correos electr