Inférence Bayesienne avec des simulateurs différentiables pour l'analyse jointe de la distribution des galaxies et du lentillage du CMB

L'objectif de ce projet de doctorat est de développer une nouvelle analyse conjointe de la distribution des galaxies mesurées par l'instrument DESI et de la mesure de Planck PR4/ACT de lentillage du fonds diffus cosmologique (CMB), en se basant sur des simulations numériques des relevés et les méthodes d'apprentissage automatique et les techniques d'inférence statistique les plus modernes. L'objectif est de surmonter les approches traditionnelles et d'améliorer la récupération des paramètres cosmologiques.
cosmologiques. L'inférence jointe des données de DESI et de Planck/ACT améliorera de manière significative les contraintes sur la croissance de la structure par rapport aux analyses DESI uniquement et de raffiner plus encore les tests de la relativité générale.

Révolutionner l'intervention en milieux complexes : L'IA et les Jumeaux numériques en synergie pour des solutions innovantes et efficaces.

Contexte scientifique
L’exploitation d’équipements complexes, notamment dans le secteur nucléaire, repose sur l’accès rapide et sécurisé à des données hétérogènes. Les avancées en IA générative, combinées aux Jumeaux Numériques (JN), offrent des solutions innovantes pour améliorer les interactions humain-système. Cependant, l’intégration de ces technologies dans des environnements critiques nécessite des approches adaptées pour garantir intuitivité, sécurité et efficacité.
Travail proposé
Cette thèse propose de développer une architecture d’IA générative enrichie par des données métiers et accessible via la réalité mixte, permettant à un opérateur de boite à gants de poser des questions en langage naturel. Les travaux incluent :
1. Une revue de l’état de l’art sur la génération augmentée (RAG), les technologies ASR/TTS et les JN.
2. Le développement et l’intégration d’un chatbot pour l’exploitation nucléaire.
3. L’évaluation des interactions humain-IA et la définition de métriques d’efficacité et d’adoption.
Résultats attendus
Le projet vise à améliorer la sécurité et la productivité grâce à une interaction optimisée et à proposer des guidelines pour l’adoption de ces systèmes dans des environnements critiques.

Apport de l’IA sur les calculs neutroniques déterministes de réacteurs SMR-REP pilotés en eau claire

Face aux enjeux climatiques, la recherche d'énergies propres et fiables se concentre sur le développement de petits réacteurs modulaires à eau sous pression (SMR de type REP), d’une puissance de 50 à 1000 MWth, qui visent à décarboner la production d'électricité et de chaleur dans la prochaine décennie. En comparaison des réacteurs en exploitation, leur taille réduite peut permettre de simplifier leur conception en n'utilisant pas de bore soluble dans l’eau du circuit primaire. Le pilotage repose alors principalement sur le niveau d’insertion des barres absorbantes, qui perturbent la distribution spatiale de puissance lorsqu’elles sont fortement insérées, ce qui provoque des pics de puissance plus prononcés que dans un cœur géré au bore soluble, et complique la gestion de la réactivité. Estimer correctement ces paramètres pose alors des défis en matière de modélisation neutronique, en particulier les effets de l’historique d’insertion des absorbants sur l’évolution isotopique du combustible. Une thèse achevée en 2022 a exploré ces effets à l’aide d’un modèle neutronique analytique, mais des difficultés subsistent car les mouvements d’absorbants neutroniques ne sont pas les seuls phénomènes à influer sur le spectre neutronique. La thèse proposée cherche à développer une méthode alternative qui permette de gagner en robustesse, tout en cherchant à réduire encore les biais de calculs. Une analyse de sensibilité sera réalisée pour identifier les paramètres clés, permettant de créer un méta-modèle utilisant l'intelligence artificielle pour corriger les biais des modèles existants. Ce projet, en collaboration avec l'IRSN et le CEA, permettra d'acquérir une expertise en physique des réacteurs, en simulations numériques et en machine learning.
Le travail de thèse sera effectué 18 mois au CEA de Cadarache et 18 mois à l’IRSN de Fontenay-aux-Roses.

Prédire la solubilité grâce à l’IA pour innover en hydrométallurgie

L’un des challenges de l’hydrométallurgie est de parvenir à trouver une molécule extractante à la fois sélective et efficace. Pour ce faire, il faut choisir parmi des milliers de possibilités, action impossible à réaliser par une méthode synthèse-test. A la place, de nombreuses études se basent sur des calculs quantiques pour évaluer l’efficacité d’un ligand à partir de la stabilité du complexe. Cependant, ces méthodes ne permettent pas de prendre en compte certains paramètres physico-chimiques essentiels à une extraction efficace tels que la solubilité.
Ce projet a donc pour objectif de développer un outil informatique basé sur l’IA capable de prédire la solubilité d’une molécule dans un solvant donné à partir de sa structure moléculaire. Dans un premier temps, l’étude se focalisera sur 3 solvants : l’eau, pour laquelle des outils pré-existants serviront de référence, l’acide nitrique 3 M pour être dans des conditions usuelles de l’industrie nucléaire, et l’octanol, solvant organique utilisé pour déterminer le coefficient de partage logP. Le projet se découpe en 4 jalons principaux :
1)Etude bibliographique d’outils similaires existants permettant de choisir les voies les plus prometteuses
2)Recherche de bases de données et complétion si nécessaire par des expériences de solubilité en laboratoire
3)Modification/création du code et entraînement du réseau de neurones sur les bases de données ainsi établies
4)Vérifications des prédictions sur des molécules non-incluses dans les bases de données par comparaison avec des mesures en laboratoire

Intégrité, disponibilité et confidentialité de l'IA embarquée dans les étapes post-apprentissage

Dans un contexte de régulation de l'IA à l'échelle européenne, plusieurs exigences ont été proposées pour renforcer la sécurité des systèmes complexes d'IA modernes. En effet, nous assistons à un développement impressionnant de grands modèles (dits modèles de "Fondation") qui sont déployés à grande échelle pour être adaptés à des tâches spécifiques sur une large variété de plateformes. Aujourd'hui, les modèles sont optimisés pour être déployés et même adaptés sur des plateformes contraintes (mémoire, énergie, latence) comme des smartphones et de nombreux objets connectés (maison, santé, IoT industriel, ...).
Cependant, la prise en compte de la sécurité de tels systèmes d'IA est un processus complexe avec de multiples vecteurs d'attaque contre leur intégrité (tromper les prédictions), leur disponibilité (dégrader les performances, ajouter de la latence) et leur confidentialité (rétro-ingénierie, fuite de données privées).
Au cours de la dernière décennie, les communautés de l'Adversarial Machine Learning et du Privacy-Preserving Machine Learning ont franchi des étapes importantes en caractérisant de nombreuses attaques et en proposant des schémas de défense. Les attaques sont essentiellement centrées sur les phases d'entraînement et d'inférence, mais de nouvelles menaces apparaissent, liées à l'utilisation de modèles pré-entraînés, leur déploiement non sécurisé ainsi que leur adaptation (fine-tuning).
Des problèmes de sécurité supplémentaires concernent aussi le fait que les étapes de déploiement et d'adaptation peuvent être des processus "embarqués" (on-device), par exemple avec l'apprentissage fédéré inter-appareils (cross device Federated Learning). Dans ce contexte, les modèles sont compressés et optimisés avec des techniques de l'état de l'art (par exemple, la quantification, le pruning ou Low Rank Adaptation - LoRA) dont l'influence sur la sécurité doit être évaluée.
La thèse se propose de (1) définir des modèles de menaces propres au déploiement et à l'adaptation de modèles de fondation embarqués (e.g., sur microcontrôleurs avec accélérateur HW, SoC); (2) démontrer et caractériser des attaques avec un intérêt particulier pour les attaques par empoisonnement de modèles; (3) proposer et développer des protections et des protocoles d'évaluation.

Transformer de vision multimodale efficace pour système embarqué

La thèse proposée se concentre sur l'optimisation des transformers multimodaux de vision (ViT) pour la segmentation panoptique d'objets, en explorant deux axes principaux. Il s'agit d'abord de développer un pipeline de fusion polyvalent pour intégrer des données multimodales (RGB, IR, profondeur, événements, nuages de points), en exploitant les relations d'alignement inter-modales. Ensuite, une approche combinant le pruning et la quantification à précision mixte sera étudiée. L'objectif global est de concevoir des modèles ViT multimodaux légers, adaptés aux contraintes des systèmes embarqués, tout en optimisant leurs performances et en réduisant la complexité computationnelle.

Top