Autoencoder enmascarado para preentrenamiento en detección de objetos en nube de puntos 3D
Autores: Xie, Guangda; Li, Yang; Qu, Hongquan; Sun, Zaiming
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Conducción autónoma
LiDAR 3D
Datos de nube de puntos
Detección de objetos
PCMAE
Aprendizaje auto-supervisado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
En la conducción autónoma, los datos en la nube de puntos 3D LiDAR (Light Detection and Ranging) del objetivo faltan debido a la larga distancia y la oclusión. Esto dificulta la detección de objetos. Este artículo propone Point Cloud Masked Autoencoder (PCMAE), que puede proporcionar un pre-entrenamiento para la mayoría de los algoritmos de detección de objetos en la nube de puntos basados en voxel. PCMAE mejora la capacidad de representación de características de la columna vertebral 3D para objetos a larga distancia y ocultos a través del aprendizaje auto-supervisado. Primero, se propone una estrategia de enmascaramiento de nube de puntos para escenas de conducción autónoma llamada PC-Mask. Se utiliza para simular el problema de la falta de información de datos de nube de puntos debido a la oclusión y la distancia en escenarios de conducción autónoma. Luego, se diseña una arquitectura de codificador-decodificador simétrica para el pre-entrenamiento. El codificador se utiliza para extraer las características de alto nivel de la nube de puntos después de PC-Mask, y el decodificador se utiliza para reconstruir la nube de puntos completa. Finalmente, el método de pre-entrenamiento propuesto en este artículo se aplica a los algoritmos de detección de objetos SECOND (Sparsely Embedded Convolutional Detection) y Part-A2-Net (Part-aware and Aggregate Neural Network). Los resultados experimentales muestran que nuestro método puede acelerar la velocidad de convergencia del modelo y mejorar la precisión de detección, especialmente el efecto de detección de objetos a larga distancia y ocultos.
Descripción
En la conducción autónoma, los datos en la nube de puntos 3D LiDAR (Light Detection and Ranging) del objetivo faltan debido a la larga distancia y la oclusión. Esto dificulta la detección de objetos. Este artículo propone Point Cloud Masked Autoencoder (PCMAE), que puede proporcionar un pre-entrenamiento para la mayoría de los algoritmos de detección de objetos en la nube de puntos basados en voxel. PCMAE mejora la capacidad de representación de características de la columna vertebral 3D para objetos a larga distancia y ocultos a través del aprendizaje auto-supervisado. Primero, se propone una estrategia de enmascaramiento de nube de puntos para escenas de conducción autónoma llamada PC-Mask. Se utiliza para simular el problema de la falta de información de datos de nube de puntos debido a la oclusión y la distancia en escenarios de conducción autónoma. Luego, se diseña una arquitectura de codificador-decodificador simétrica para el pre-entrenamiento. El codificador se utiliza para extraer las características de alto nivel de la nube de puntos después de PC-Mask, y el decodificador se utiliza para reconstruir la nube de puntos completa. Finalmente, el método de pre-entrenamiento propuesto en este artículo se aplica a los algoritmos de detección de objetos SECOND (Sparsely Embedded Convolutional Detection) y Part-A2-Net (Part-aware and Aggregate Neural Network). Los resultados experimentales muestran que nuestro método puede acelerar la velocidad de convergencia del modelo y mejorar la precisión de detección, especialmente el efecto de detección de objetos a larga distancia y ocultos.