Le sujet de ce post-doc concerne la détection et la reconnaissance d’objets dans des images et les flux vidéo à grande échelle. Il s’agit d’une tâche fondamentale qui est l’objet de recherches très actives au niveau mondial, et une tendance affirmée en ce qui concerne les campagnes d’évaluation. L’aspect « grande échelle » concerne à la fois des bases de taille importantes (e.g dix millions d’images) ou un grand nombre de concepts à reconnaître (e.g 100 à 10000). Il s’agit alors de travailler à la fois sur la partie description des images et classification grande échelle.
Au niveau de la description, les résultats de l’état de l’art reposent sur des descripteurs locaux agrégés selon des dictionnaires de « mots visuels »éventuellement construits au moyen de noyaux de Fisher. Il est néanmoins nécessaire de recoder efficacement ces signatures de manière à gérer les grandes bases. Concernant l’apprentissage des concepts visuels ou des objets, de nombreux algorithmes utilisent des séparateurs à vaste marge mais d’autres approches sont parfois envisagées, comme celles basées ou la régression logistique.
Le poste proposé porte sur la recherche et le développement d’algorithmes efficaces permettant de rechercher des entités visuelles dans de très grandes bases. Différentes pistes sont envisagées et devront être discutées avec le candidat sélectionné en fonction des ses connaissances antérieures et de discussions techniques.