Tiempo real detección de objetos es una parte crucial de los vehículos autónomos. Sin embargo, los enfoques actuales no permiten cambiar dinámicamente el tiempo y las propiedades computacionales del sistema de detección de objetos. Un artículo reciente en arXiv.org propone un método novedoso para brindar flexibilidad en el tiempo de ejecución a las canalizaciones de detección de objetos basadas en el aprendizaje automático.
Los investigadores modifican la columna vertebral del modelo para que sea parcialmente ejecutable con un mínimo esfuerzo. Además, se permite omitir un subconjunto de cabezales de detección para permitir una compensación precisa del tiempo de ejecución y la precisión. Un mecanismo de proyección compensa la posible pérdida de precisión debido a cabezas omitidas. El programador de dos fases gestiona la ejecución de la red troncal, los cabezales de detección y la proyección con el objetivo de maximizar la precisión de la detección y cumplir los plazos.
Los resultados muestran que el método propuesto puede reducir su requisito de tiempo de ejecución en un 50 por ciento y proporcionar una mayor precisión que sus alternativas.
En este trabajo, presentamos un marco de programación novedoso que permite la percepción en cualquier momento para canalizaciones de detección de objetos 3D basadas en redes neuronales profundas (DNN). Nos enfocamos en la red de propuesta de región (RPN) computacionalmente costosa y los componentes de detectores de cabezales múltiples por categoría, que son comunes en las canalizaciones de detección de objetos 3D, y los hacemos conscientes de la fecha límite. Proponemos un algoritmo de programación, que selecciona de manera inteligente el subconjunto de los componentes para hacer un compromiso efectivo de tiempo y precisión sobre la marcha. Minimizamos la pérdida de precisión al omitir algunos de los subcomponentes de la red neuronal al proyectar objetos previamente detectados en la escena actual a través de estimaciones. Aplicamos nuestro enfoque a una red de detección de objetos 3D de última generación, PointPillars, y evaluamos su rendimiento en Jetson Xavier AGX utilizando el conjunto de datos nuScenes. En comparación con las líneas de base, nuestro enfoque mejora significativamente la precisión de la red bajo varias limitaciones de plazo.
Artículo de investigación: Soyyigit, A., Yao, S. y Yun, H., “Anytime-Lidar: detección de objetos 3D con fecha límite”, 2022. Enlace: https://arxiv.org/abs/2208.12181