Investigación sobre Máquina de Vectores de Soporte Paralela basada en la plataforma de datos masivos Spark.
Autores: Huimin, Yao
Idioma: Inglés
Editor: Hindawi
Año: 2021
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
Con el desarrollo de la computación en la nube y la tecnología de clústeres distribuidos, el concepto de big data se ha expandido y extendido en términos de capacidad y valor, y la tecnología de aprendizaje automático también ha recibido una atención sin precedentes en los últimos años. Los algoritmos tradicionales de aprendizaje automático no pueden resolver el problema de la paralelización efectiva, por lo que se propone una máquina de soporte vectorial paralela basada en la plataforma de big data Spark. En primer lugar, se diseña la plataforma de big data con la arquitectura Lambda, que se divide en tres capas: Capa Batch, Capa de Servicio y Capa de Velocidad. En segundo lugar, para mejorar la eficiencia de entrenamiento de las máquinas de soporte vectorial en datos a gran escala, al fusionar dos máquinas de soporte vectorial, se consideran los puntos especiales que no son vectores de soporte, es decir, los puntos donde los no vectores de soporte en un subconjunto violan los resultados de entrenamiento del otro
Descripción
Con el desarrollo de la computación en la nube y la tecnología de clústeres distribuidos, el concepto de big data se ha expandido y extendido en términos de capacidad y valor, y la tecnología de aprendizaje automático también ha recibido una atención sin precedentes en los últimos años. Los algoritmos tradicionales de aprendizaje automático no pueden resolver el problema de la paralelización efectiva, por lo que se propone una máquina de soporte vectorial paralela basada en la plataforma de big data Spark. En primer lugar, se diseña la plataforma de big data con la arquitectura Lambda, que se divide en tres capas: Capa Batch, Capa de Servicio y Capa de Velocidad. En segundo lugar, para mejorar la eficiencia de entrenamiento de las máquinas de soporte vectorial en datos a gran escala, al fusionar dos máquinas de soporte vectorial, se consideran los puntos especiales que no son vectores de soporte, es decir, los puntos donde los no vectores de soporte en un subconjunto violan los resultados de entrenamiento del otro