Qui sommes-nous ?
Espace utilisateur
Formation continue
Credit : L. Godart/CEA
D’un jour à plusieurs semaines, nos formations permettent une montée en compétence dans votre emploi ou accompagnent vers le retour à l’emploi. 
Conseil et accompagnement
Crédit : vgajic
Fort de plus de 60 ans d’expériences, l’INSTN accompagne les entreprises et organismes à différents stades de leurs projets de développement du capital humain.
Thèses
Accueil   /   Thèses   /   Méthodes faiblement-supervisées pour l’analyse de nuages de points 3D

Méthodes faiblement-supervisées pour l’analyse de nuages de points 3D

Data intelligence dont Intelligence Artificielle Défis technologiques

Résumé du sujet

L'utilisation de capteurs 3D LiDAR a considérablement progressé au cours des dernières années, atteignant un statut industrialisable tant en terme de capteurs que de méthodes. Dans le contexte de l'aide à la conduite ou de la conduite autonome, les données de LiDAR fournissent une information fine et fiable pour la perception de l'environnement. Ainsi, sur les tâches de détection, de suivi, ou encore de segmentation sémantique, de nombreuses méthodes démontrent des performances à l'état de l'art en utilisant cette seule source de données. Ces méthodes se caractérisent par une importante réutilisation des développée pour les images dans le domaine du spectre visible, avec trois axes principaux de contributions: la réduction du problème à la 2D, l’extension des méthodes 2D à la 3D, et l’exploitation de propriétés spécifiques à la 3D pour affiner la qualité de modélisation. Plusieurs verrous scientifiques demeurent cependant:

• Les bases de données publiques ne sont pas représentatives de la variété des situations et des environnements habituels de conduite, comme en témoignent les expériences de transfert de domaine. C’est particulièrement le cas pour des cas rares, telles ques les situations accidentogènes. En vue d'un déploiement à grande échelle, il est donc nécessaire d'entraîner les modèles sur des données plus diverses.

• Les données d'une unique prise de vue et d’un seul capteur contiennent de multiples ambiguïtés provenant d’une part des occultations et d’autre part de la faible résolution des capteurs.

Parallèlement, les méthodes d’apprentissage auto-supervisées ou faiblement supervisées dans les domaine de l’image, du texte ou de la vidéo se sont considérablement améliorées ces dernières années, et adapter ces démarches à des données 3D permettrait de tirer parti de larges quantités de données non-annotées qui peuvent être acquises à moindre coût.

Parmi ces approches celles s’appuyant sur la cohérence temporelles semblent particulièrement adaptées au contexte des nuages de points 3D. Les approches temporelles n’ont été que peu explorée jusqu’ici du fait de la complexité calculatoire qu’elles impliquent, mais sont rendues plus accessibles par les nouvelles générations de calculateurs GPU. La combinaison temporelle des points issus de plusieurs vues instantanées du lidar apporterait des données plus résolues sur la scène à analyser.

L’objectif de cette thèse est d’améliorer la fiabilité et la qualité de généralisation des modèles de perception sur des nuages de points 3D. La personne recrutée pourra dans un premier temps étudier la pertinence des méthodes développées sur d’autres types de données, notamment dans les domaines de l’image et de la vidéo, puis chercher à tirer partie des hypothèses spécifiques aux données 3D, notamment la cohérence temporelle de l’environnement observé.

Laboratoire

Département Intelligence Ambiante et Systèmes Interactifs (LIST)
Service Intelligence Artificielle pour le Langage et la Vision
Laboratoire Vision et Apprentissage pour l’analyse de scènes
Top pencilenvelopegraduation-hatlicensebookuserusersmap-markercalendar-fullbubblecrossmenuarrow-down