MonoGhost: Estimación de propiedades de objetos 3D con GhostNet monocular ligero para conducción autónoma
Autores: El-Dawy, Ahmed; El-Zawawi, Amr; El-Habrouk, Mohamed
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Efectivo
Percepción ambiental
Conducción autónoma
Aprendizaje profundo
Red MonoGhost
Propiedades de objetos 3D
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La percepción ambiental efectiva es crítica para la conducción autónoma; por lo tanto, el sistema de percepción requiere recopilar información 3D de los objetos circundantes, como sus dimensiones, ubicaciones y orientación en el espacio. Recientemente, el aprendizaje profundo se ha utilizado ampliamente en sistemas de percepción que convierten características de imagen de una cámara en información semántica. Este documento presenta la red MonoGhost, una técnica de aprendizaje profundo Monocular GhostNet ligera para la estimación completa de propiedades de objetos 3D a partir de una única imagen monocular. A diferencia de otras técnicas, la red MonoGhost propuesta primero estima propiedades de objetos 3D relativamente confiables dependiendo de un extractor de características eficiente. La red MonoGhost propuesta estima la orientación del objeto 3D así como las dimensiones 3D de ese objeto, resultando en errores razonablemente pequeños en las estimaciones de dimensiones en comparación con otras redes. Estas estimaciones, combinadas con las restricciones de proyección de traducción impuestas por las coordenadas de detección 2D, permiten la predicción de una caja delimitadora robusta y confiable en vista de pájaro. Los resultados experimentales demuestran que la red MonoGhost propuesta tiene un mejor rendimiento que otras redes de última generación en la vista de pájaro del conjunto de datos KITTI, obteniendo un 16.73% en la clase moderada y un 15.01% en la clase difícil, mientras se mantienen los requisitos de tiempo real.
Descripción
La percepción ambiental efectiva es crítica para la conducción autónoma; por lo tanto, el sistema de percepción requiere recopilar información 3D de los objetos circundantes, como sus dimensiones, ubicaciones y orientación en el espacio. Recientemente, el aprendizaje profundo se ha utilizado ampliamente en sistemas de percepción que convierten características de imagen de una cámara en información semántica. Este documento presenta la red MonoGhost, una técnica de aprendizaje profundo Monocular GhostNet ligera para la estimación completa de propiedades de objetos 3D a partir de una única imagen monocular. A diferencia de otras técnicas, la red MonoGhost propuesta primero estima propiedades de objetos 3D relativamente confiables dependiendo de un extractor de características eficiente. La red MonoGhost propuesta estima la orientación del objeto 3D así como las dimensiones 3D de ese objeto, resultando en errores razonablemente pequeños en las estimaciones de dimensiones en comparación con otras redes. Estas estimaciones, combinadas con las restricciones de proyección de traducción impuestas por las coordenadas de detección 2D, permiten la predicción de una caja delimitadora robusta y confiable en vista de pájaro. Los resultados experimentales demuestran que la red MonoGhost propuesta tiene un mejor rendimiento que otras redes de última generación en la vista de pájaro del conjunto de datos KITTI, obteniendo un 16.73% en la clase moderada y un 15.01% en la clase difícil, mientras se mantienen los requisitos de tiempo real.