Extraction de relations complexes et d'événements few-shot à partir de texte appliquée à la littérature scientifique
L'extraction d'information à partir de textes, qui se rattache plus généralement au traitement automatique des langues, a fait l'objet de travaux depuis de nombreuses années centrées sur la reconnaissance d'entités nommées, l'extraction de relations entre ces entités et pour sa partie la plus complexe, celle d'événements, qui prend la forme d'une tâche de remplissage de formulaires (templates) prédéfinis à partir de textes. Dans ce contexte, l'objectif de la thèse est de concevoir, développer et évaluer des modèles d'extraction d'événements opérant sur des articles scientifiques, un événement pouvant correspondre dans ce contexte à un ensemble d'entités et de relations caractérisant par exemple une expérience ou une réaction chimique. De plus, ces modèles devront pouvoir être définis à partir d'un ensemble très restreint de données annotées afin de s'adapter rapidement à un nouveau domaine scientifique.
Sur le plan méthodologique, la thèse proposée cherche à dépasser la tendance que l'on pourrait qualifier de presque naturelle dans le contexte actuel à se tourner vers les grands modèles de langue génératifs (LLM) en défendant l'idée d'une synergie possible entre LLM et modèles plus petits de type encodeur dans un contexte few-shot, synergie dans laquelle les premiers permettent, grâce à la génération de données et d'annotations synthétiques, de construire les ressources permettant de mettre en œuvre les seconds par le biais de mécanismes de préentraînement. La thèse prendra place dans le contexte du projet AIKO de l’agence de programmes numérique, focalisé sur l'extraction de connaissances à partir de publications scientifiques.
Architecture d'un système de tomoscintigraphie préclinique
L’imagerie médicale est une source majeure d’innovations offrant un potentiel remarquable pour relever les nouveaux défis posés par la médecine de précision. En particulier les approches théranostiques, mêlant diagnostic et thérapie peuvent être personnalisées pour chaque patient.
Dans ce cadre, le CEA-Leti propose un sujet de thèse visant à développer un imageur tomoscintigraphique préclinique dédié, capable de fournir les performances requises pour le développement de nouveaux radiopharmaceutiques (spectrométrie, résolution spatiale et sensibilité élevée). Le laboratoire dispose en effet d’une expertise reconnue dans les détecteurs semi-conducteurs à base de CZT (Tellurure de Cadmium-Zinc) qui offrent une meilleure résolution spatiale et énergétique que les scintillateurs utilisés dans la plupart des systèmes actuels. Ces détecteurs ouvrent de nouvelles perspectives pour l’imagerie d’émission, telles que l'exploitation de l'imagerie Compton, l'imagerie multi-isotopique et le gain en contraste.
Le ou la candidate aura a prendre en charge :
1. L'étude de l'état de l'art en imagerie tomoscintigraphique préclinique pour participer à la spécification système et aider à définir une architecture de système.
2. La simulation de l'architecture par Monte-Carlo et l'optimisation des paramètres libres.
3. La conception et la fabrication d'un prototype avec l'aide de l'équipe d'ingénieurs.
4. Le test et la validation en imagerie, en utilisant les logiciels d'acquisition et reconstruction fournis par l'équipe.
Le doctorat se déroulera au sein d'un laboratoire d'instrumentation équipé en électroniques, détecteurs, mécaniques de motorisation, sources, logiciels d'acquisition, traitement et reconstruction. Le ou la doctorante collaborera avec le centre clinique et préclinique de l'hôpital d'Orsay pour conduire des tests d'imagerie sur fantômes et animaux.
Développement accéléré de la technologie Zn-MnO2 pour le stockage longue durée par hybridation simulation-données
Le déploiement massif des énergies renouvelables impulse une demande croissante pour le stockage stationnaire, dont les spécificités (coût, sécurité, durabilité) diffèrent radicalement de la mobilité électrique. Face aux limites des batteries Li-ion (risques d'incendie, criticité du lithium et du cobalt, coûts de production), la technologie aqueuse Zinc-Manganèse (Zn-MnO2) s'impose comme une alternative de rupture. Basée sur des matériaux abondants, non toxiques et intrinsèquement sûrs, elle offre un potentiel unique pour le stockage de longue durée à faible impact environnemental.
Cependant, l'industrialisation de cette filière se heurte à des verrous scientifiques limitant la réversibilité et la durée de vie en cyclage, notamment la formation de dendrites de zinc et l'instabilité de la cathode. Ce projet de thèse propose de surmonter ces obstacles par une stratégie de recherche hybride couplant modélisation multiphysique et intelligence artificielle.
Dans un premier temps, un modèle en éléments finis sera développé et validé expérimentalement pour caractériser les mécanismes de dégradation (points chauds de densité de courant, gradients de concentration). Dans un second temps, ce modèle servira de générateur de données pour entraîner des algorithmes d'apprentissage automatique (Machine Learning). Ces modèles de substitution permettront d'explorer rapidement un vaste espace de conception pour identifier les architectures les plus résilientes. L'objectif final est d'accélérer l'éco-conception de batteries Zn-MnO2 performantes, répondant aux impératifs de souveraineté énergétique et d'économie circulaire.
Développement soutenable de circuits et systèmes numériques : Prise en compte des limites planétaires
Les développements technologiques dans le secteur de l’électronique connaissent une croissance rapide, accompagnée d’un intérêt accru pour la prise en compte de leurs impacts environnementaux. Toutefois, les approches actuelles restent majoritairement centrées sur des réductions relatives des impacts (efficacité énergétique, optimisation des ressources), sans garantir une compatibilité réelle avec les limites planétaires. Dans ce contexte, la notion de soutenabilité absolue apparaît comme un cadre indispensable pour orienter les futurs développements des systèmes électroniques.
La thèse s’attaque à plusieurs défis scientifiques majeurs : comment identifier, pour le secteur électronique, des capacités de charge et des principes de partage, notions de base de la soutenabilité absolue, déclinables jusqu’aux niveaux des systèmes numériques et des circuits intégrés ? Comment intégrer concrètement les limites planétaires dans la conception de systèmes et circuits ?
L’objectif principal de cette thèse est de passer d’une logique de réduction relative des impacts environnementaux à une conception compatible avec les limites planétaires. Elle vise à définir des scénarios socio-techniques permettant d’identifier des principes de partage, à réaliser la première analyse de cycle de vie absolue d’un système numérique, et à proposer la première conception d’un circuit fondée sur des limites absolues, ouvrant la voie à un développement réellement soutenable de l’électronique.
Atteindre des performances magnétiques élevées dans les aimants 1-12 pauvres en Terres Rares par la maitrise de la composition et de la microstructure
Les aimants permanents à base de terres rares (TR), notamment les aimants néodyme-fer-bore (Nd-Fe-B), sont essentiels pour le développement de moteurs et de générateurs efficaces, tels que ceux utilisés dans les véhicules électriques et les éoliennes. Cependant, les TR, en particulier le néodyme (Nd), sont des matériaux critiques avec un risque élevé d'approvisionnement dans les années à venir. La demande croissante en aimants de haute performance nécessite le développement de nouveaux types d'aimants sobres en TR. Les composés riches en fer, de type Sm-Fe12 (phase 1-12), présentent des propriétés magnétiques intrinsèques très prometteuses et sont considérés comme la meilleure alternative aux aimants Nd-Fe-B, permettant une réduction de l'utilisation des TR d'environ 35 % en poids. Néanmoins, l'atteinte des performances magnétiques requises (rémanence > 1 T et coercitivité > 800 kA/m) repose sur l’obtention d'une microstructure adaptée, ce qui constitue le principal défi dans le développement des aimants Sm-Fe12. L'objectif de cette thèse est d'améliorer les performances magnétiques de cette nouvelle famille d'aimants en maîtrisant la composition et la répartition des phases aux joints de grains. Le travail de doctorat combinera une approche expérimentale approfondie, incluant l'élaboration d'alliages de type Sm-Fe12, la caractérisation des phases à l'équilibre, la fabrication d'aimants et les caractérisations magnétiques, avec une analyse détaillée des diagrammes de phases. Cette démarche vise à définir les compositions et les conditions de fabrication optimales pour atteindre les performances magnétiques ciblées.
DevOps piloté par les modèles pour l'orchestration cloud : Relier les garanties de conception et d'exécution
L'ingénierie dirigée par les modèles (MDE) repose traditionnellement sur une séparation nette entre conception et exécution, mais cette frontière ne tient plus dans les environnements cloud natifs et edge actuels, où les infrastructures sont hétérogènes, dynamiques et en constante évolution. Les hypothèses validées à la conception peuvent devenir invalides à l'exécution, et les plateformes d'orchestration modernes comme Kubernetes ou OpenStack, bien qu'efficaces, restent faiblement connectées aux environnements de modélisation architecturale. Il en résulte un écart structurel entre la spécification architecturale et le comportement opérationnel réel. Pour combler ce fossé, cette thèse propose de développer un cadre formel de modélisation des contraintes de placement sur des plateformes d'orchestration hétérogènes, en assurant une continuité entre la validation à la conception et les garanties à l'exécution. Ce cadre élèverait les contraintes de placement — localité des ressources, affinité, latence réseau, isolation sécurité, objectifs de qualité de service — au rang de construits de modélisation de premier ordre. À la conception, il permettrait une analyse statique de faisabilité et la génération automatisée d'artefacts de déploiement ; à l'exécution, il assurerait une surveillance continue de la conformité et une reconfiguration adaptative en cas de violation. Les contributions attendues incluent un langage formel de modélisation, des transformations bidirectionnelles entre modèles de conception et représentations d'exécution, ainsi qu'une intégration avec l'outillage Papyrus. L'objectif final est de garantir que l'intention architecturale reste cohérente et vérifiable tout au long du cycle de vie du système, de sa conception jusqu'à son exploitation en production.
Exploration non-invasive de la microstructure du cervelet par résonance magnétique
Pour mieux diagnostiquer et suivre l’évolution des maladies du cerveau, il est nécessaire de développer des “biopsies non-invasives”, afin d’accéder à l’état des types cellulaires constituant le tissu cérébral et sa composition, sans ouvrir la boîte crânienne. Les efforts de recherche en imagerie par résonance magnétique (IRM) visent à relever ce défi, mais ils manquent souvent de spécificité cellulaire à cause de la nature ubiquitaire de l’eau. La spectroscopie par résonance magnétique pondérée en diffusion (dMRS) mesure, dans une région donnée, la diffusion de molécules intracellulaires et partiellement spécifiques. Elle dessine une base solide pour accéder aux différents types cellulaires de manière non-invasive. Parmi les questions d’intérêt, séparer les contributions au signal des différents neurones du cervelet contribuerait à suivre et comprendre les troubles ataxiques et neurodéveloppementaux. Le cervelet ne représente que 10% du volume du cerveau, mais contient plus de la moitié de ses neurones, dont notamment les cellules de Purkinje, grandes et très complexes, et les cellules granulaires, petites et rondes, ayant des fonctions et un métabolisme très différents. Le projet de thèse a pour objectif de dissocier la contribution au signal de ces cellules grâce à des stratégies complémentaires: une approche classique de la dMRS augmentée d’une approche quantique, tout en confrontant ces développements à l’état de l’art des méthodes de l’IRM de la microstructure.
Apprentissage multimodal distribué pour la localisation et la classification coopératives de sources acoustiques
Dans de nombreux environnements complexes, tels que les sites industriels, bâtiments sinistrés, espaces publics, il est nécessaire de détecter et localiser automatiquement des événements sonores (chutes, alarmes, voix, pannes mécaniques). Les plateformes mobiles équipés de caméras et de microphones constituent une solution prometteuse, mais une seule plateforme reste limité : son réseau de microphone donne une direction approximative vers la source, mais pas une position précise dans l'espace, et sa caméra peut être obstruée. Ce sujet propose d'étudier comment des multi-plateformes, chacune portant une unité audio-visuelle calibrée, peuvent collaborer pour localiser et classifier ces événements en 3D. Chaque plateforme analyse ses propres observations audio-visuelles et partage une estimation de la direction de la source avec ses voisines ; le réseau combine ensuite ces estimations pour reconstruire la position de l'événement et l'identifier. Les résultats attendus sont un système de localisation coopérative robuste aux occultations et aux défaillances partielles.
Résonateurs acoustiques exploitant des modes isolés topologiquement
Les références de temps sont des fonctions critiques pour les systèmes électroniques. Elles permettent en effet la synchronisation des signaux, que ce soit à l'échelle d'une puce ou lors de transfert de données sans fil. Ces références de temps sont basées sur des oscillateurs délivrant une fréquence la plus stable possible. La référence en la matière restent les résonateurs à quartz, qui sont néanmoins volumineux et ne peuvent donc pas être intégrés dans une puce. La recherche cherche donc à l'heure actuelle toujours à miniaturiser des résonateurs capables de fournir des coefficients de qualité élevés (> 10,000), idéalement à des fréquences de plusieurs GHz. Une des contraintes est d'être capable de confiner les vibrations dans des structures microniques afin de les rendre insensibles aux perturbations extérieures. Récemment est apparu le domaine de l'acoustique topologique, qui a permis de démontrer que des ondes élastiques pouvaient être confinées dans de très petits volumes, à l'interface entre des structures périodiques, et que des coefficients de qualité très élevés ont pu être atteints.
Cette thèse porte sur l'exploitation de modes ainsi protégés topologiquement dans des microstructures piézoélectriques, en vue de démontrer de nouveaux types de résonateurs possédant des coefficients de qualité élevés, pouvant trouver des applications aussi bien dans des oscillateurs que dans des systèmes de capteurs ou dans des circuits de filtres. Le candidat pourra tirer parti du savoir faire du CEA Leti dans la conception et la fabrication de résonateurs piézoélectriques. La thèse s'inscrit dans le contexte d'une collaboration internationale avec des laboratoires académiques renommés dans le sujet (Politecnico di Milano, Imperial College, Institut FEMTO-ST), ainsi qu'avec des partenaires industriels.
Le candidat s'intéressera à la modélisation et à la conception de structures dans lesquelles des modes isolés topologiquement peuvent exister, en combinant des modélisations par éléments finis et des modèles numériques approchés, mais plus simples à exploiter systématiquement. Il sera en charge de fabriquer des démonstrateurs, en lien avec les plateformes technologiques du CEA-Leti et des équipes dédiés à l'intégration et à la fabrication. Enfin, il assurera le test et l'évaluation des objets réalisés.
Synergie potentielle entre le NH3 et le NaBH4 pour une meilleure densité en H2 et une sécurité accrue
La thèse porte sur l’étude du système hybride ammoniac-borohydrure de sodium NH3–NaBH4 comme vecteur énergétique chimique innovant. Elle vise à étudier l’association entre l’ammoniac NH3, reconnu pour sa forte densité en H2 et ses filières industrielles matures, et le borohydrure de sodium NaBH4, matériau de stockage chimique de l’H2 à haute capacité, afin de lever certaines limitations propres à chacun de ces vecteurs pris séparément.
Le travail proposé s’intéresse en particulier au stockage et au transport plus sûrs de l’ammoniac par son couplage avec le borohydrure de sodium, permettant un abaissement de la pression de vapeur (vs. 8,88 bar à 21 °C pour l’ammoniac liquide) et des conditions de mise en œuvre moins contraignantes. En parallèle, la thèse vise à améliorer la stabilité (en comparaison au système H2O–NaBH4) et l’opérabilité du borohydrure de sodium qui, par combinaison avec des molécules d’ammoniac (inertes), forme des phases liquides ou visqueuses stables, potentiellement pompables, favorisant son intégration dans des procédés énergétiques.
L’objet fondamental de la thèse est de comprendre les mécanismes physico-chimiques gouvernant ce système hybride, notamment le rôle des interactions dihydrogène entre les liaisons N–H de l’ammoniac et B–H du borohydrure, et leur influence sur la stabilité, la réactivité, les propriétés de transport et les voies (thermiques et/ou hydrolytiques) de mise à disposition de l’H2.
Au-delà de la fonction de stockage, la thèse explore également le potentiel du système NH3–NaBH4 comme nouveau matériau hybride à forte capacité massique et volumique en H2, en lien avec des contraintes réalistes d’usage énergétique dans le cadre d’applications duales, sans viser à ce stade une optimisation exhaustive.