Détection d'anomalies dans les vidéos adaptative et explicable

La détection d'anomalies dans les vidéos (VAD) vise à identifier automatiquement les événements inhabituels dans des séquences vidéo qui s’écartent des comportements normaux. Les méthodes existantes reposent souvent sur l'apprentissage One-Class ou faiblement supervisé : le premier n'utilise que des données normales pour l'entraînement, tandis que le second s'appuie sur des labels au niveau de la vidéo. Les récents progrès des modèles Vision-Langage (VLM) et des grands modèles de langage (LLM) ont permis d’améliorer à la fois les performances et l’explicabilité des systèmes VAD. Malgré des résultats prometteurs sur des jeux de données publics, plusieurs défis subsistent. La plupart des méthodes sont limitées à un seul domaine, ce qui entraîne une baisse de performance lorsqu'elles sont appliquées à de nouveaux jeux de données avec des définitions d’anomalies différentes. De plus, elles supposent que toutes les données d'entraînement sont disponibles dès le départ, ce qui est peu réaliste dans des contextes d’utilisation réels où les modèles doivent s’adapter continuellement à de nouvelles données. Peu d’approches explorent l’adaptation multimodale en utilisant des règles en langage naturel pour définir les événements normaux ou anormaux. Or, cela permettrait une mise à jour plus intuitive et flexible des systèmes VAD sans nécessiter de nouvelles vidéos.

Ce sujet de thèse a pour objectif de développer des méthodes de détection d’anomalies vidéo adaptables, capables de traiter de nouveaux domaines ou types d’anomalies en s’appuyant sur peu d’exemples vidéo et/ou des règles textuelles.

Les axes de recherche principaux seront les suivants :
• Adaptation interdomaines en VAD : améliorer la robustesse face aux écarts de domaine via une adaptation Few-Shot ;
• Apprentissage continu en VAD : enrichir le modèle en continu pour traiter de nouveaux types d’anomalies ;
• Apprentissage multimodal en Few-Shot : faciliter l’adaptation du modèle à l’aide de règles en langage naturel.

Apprentissage informé par la physique pour les problèmes inverses acoustiques : reconstruction de champs, détection et analyse de détectabilité en environnements complexes

Cette thèse vise à développer un cadre mathématique et algorithmique pour la résolution de problèmes inverses acoustiques en environnements complexes, fondé sur l’apprentissage informé par la physique. En intégrant explicitement l’équation des ondes dans des architectures d’intelligence artificielle, l’objectif est d’améliorer la reconstruction de champs acoustiques à partir de mesures partielles, la localisation de sources mobiles et l’analyse quantitative de leur détectabilité. Le projet combine modélisation des équations aux dérivées partielles, optimisation contrainte et apprentissage profond hybride. Les applications concernent les systèmes de perception acoustique distribuée et la détection de plateformes mobiles.

Développement et validation d’algorithmes d’intelligence artificielle, appliqués à l’haptique surfacique, pour l’évaluation des troubles neurodéveloppementaux à travers le toucher et la dextérité

L'objectif de cette thèse est de développer de nouvelles méthodes d'évaluation clinique utilisant des technologies haptique surfaciques, développées au CEA List, et des algorithmes de machine learning pour tester et mesurer l'intégration tactile-motrice. En particulier, la thèse investiguera et validera le développement d'un pipeline d'analyse multimodale qui convertit les signaux haptique et les données des exercices de dextérité (c'est-à-dire les événements de stimulation tactile, la cinématique des doigts, les forces de contact et le timing en millisecondes) en biomarqueurs fiables et interprétables de la perception tactile et du couplage sensorimoteur, puis classera les schémas d'intégration normatifs par rapport aux schémas atypiques avec une fidélité clinique pour l'évaluation.
Résultats attendus : une nouvelle technologie et des modèles pour la mesure rapide et réalisable des déficits tactuo-moteurs en milieu clinique, avec une validation initiale pour différents troubles du neurodéveloppement (c'est-à-dire la psychose, le trouble du spectre autistique et la dyspraxie). Les méthodes développées et les données collectées fourniront :
(1) une bibliothèque de caractéristiques ouverte et versionnée pour l'évaluation tactuo-motrice ;
(2) des classifieurs avec des points de fonctionnement prédéfinis (sensibilité/spécificité) ;
(3) et une pipeline « edge-ready » sur le dispositif, c'est-à-dire capable de fonctionner localement sur une tablette tout en respectant les contraintes de latence, de calcul et de confidentialité des données. Le succès sera mesuré par la reproductibilité des caractéristiques, des tailles d'effet cliniquement significatives et une logique de décision interprétable qui se rapporte à la neurophysiologie connue plutôt qu'à des artefacts.

Top