Pix2Point : prédiction monoculaire de scènes 3D par réseaux de neurones hybrides et transport optimal

Autor: Rémy Leroy, Bertrand Le Saux, Marcela Pinheiro de Carvalho, Pauline Trouvé-Peloux, Frédéric Champagnat
Přispěvatelé: DTIS, ONERA, Université Paris Saclay [Palaiseau], ONERA-Université Paris-Saclay
Jazyk: francouzština
Rok vydání: 2020
Předmět:
Zdroj: RFIAP 2020
RFIAP 2020, Jun 2020, VANNES, France
HAL
Popis: International audience; Estimer la géométrie 3D d’une scène est crucial pour la reconstruction et la compréhension de celle-ci. L’information 3D est obtenue traditionnellement par stéréovision, et plus récemment par apprentissage profond avec d’excellents résultats même avec une seule vue. Cependant, il ne s’agit le plus souvent que de cartes de profondeur ou de disparité, alors que de nombreuses applications telles que la conduite autonome, la métrologie ou la robotique ont pour standard des nuages de points 3D, notamment car il s’agit du format natif des capteurs laser. Cet article présente Pix2Point, une approche de prédiction de nuage de points 3D d’une scène complète à partir d’une seule image. Elle repose sur une architecture de réseau de neurones hybride 2D-3D, et d’un apprentissage de bout-en-bout minimisant une distance de transport optimal. Nous montrons que notre approche obtient des résultats prometteurs pour la tâche de reconstruction monoculaire de nuage de points de scènes réelles issue du jeu de données KITTI. N’ayant pas encore été abordée, nous proposons des premières valeurs de référence pour cette tâche.
Databáze: OpenAIRE