Optimisation d'architecture neuronale post-entraînement pour petit modèles de langage
L’IA générative, et en particulier les modèles de langage (LLM), ont conduit à une nouvelle révolution de l'IA avec des applications dans tous les domaines. Cependant, les LLM sont très gourmands en ressources (énergie, calculs, etc.) et, par conséquent, difficiles à mettre en œuvre sur des systèmes embarqués autonomes. Les LLM peuvent être optimisés en modifiant leur architecture, pour remplacer les opérations de Transformer coûteuses par des alternatives moins coûteuses. Etant donné la difficulté d’entraîner des LLM « from scratch », cette thèse vise à développer des méthodes d’optimisation d’architecture neuronale post-entraînement, applicable à des petits LLM (SLM). De plus, la thèse vise à proposer un modèle de performance des différentes opérations d’un SLM et leurs alternatives, afin de guider le remplacement des opérations, et ainsi proposer une méthodologie complète d’optimisation de SLM en prenant en compte les contraintes matérielles. Le travail sera valorisé par des publications dans des conférences et journaux de rang majeur en IA, et les codes et méthodes développés pourront être intégrés dans les outils développés au CEA.
Développement d’une anode innovante à base de matériaux non critiques et durables pour l’électrolyse à membrane échangeuse d’anions
L’électrolyse de l’eau à membrane échangeuse d’anions (AEMWE) est une technologie récente et prometteuse pour produire de l’hydrogène vert, mais elle rencontre encore des défis majeurs en termes de performance et de durabilité. Actuellement, les anodes des électrolyseurs AEMWE sont constituées de deux couches : une couche poreuse (PTL), qui permet la circulation de l’électrolyte et des gaz, et une couche active, composée de catalyseurs et de liants, où se déroulent les réactions électrochimiques. Cette configuration limite la diffusion des réactifs et réduit la surface active disponible pour les réactions, ce qui impacte négativement les performances globales.
Ce projet de thèse propose de développer une anode innovante, basée sur des matériaux non critiques, en combinant les avantages des deux couches tout en minimisant leurs inconvénients. L’approche proposée consiste à fonctionnaliser la PTL, par l’ajout de nanoparticules catalytiques et/ou par une activation de surface, afin de lui conférer une activité électrochimique. Ces modifications permettront d’améliorer le transport des électrons et des réactifs, tout en augmentant la surface active pour la réaction d’évolution de l’oxygène (OER).
Le travail de cette thèse consistera à fonctionnaliser une PTL préalablement sélectionnée, puis à caractériser les anodes obtenues par des analyses structurales et électrochimiques approfondies. Les résultats attendus dans cette thèse est la réalisation d’une anode optimisée, offrant des performances accrues et une dégradation limitée, ainsi qu’une meilleure compréhension des phénomènes limitants dans les anodes AEMWE. Ce projet s’inscrit dans une démarche de développement de technologies durables, essentielles pour la transition énergétique.
Micro-électrolyse en continu pour une synthèse plus vertueuse de nanoparticules d'or
Les nanoparticules (NPs) d'or possèdent des propriétés électroniques, photoniques et chimiques uniques, qui les rendent incontournables pour un grand nombre d'applications technologiques ou médicales. Elles sont typiquement produites par précipitation contrôlée du métal à partir d'une solution aqueuse d'un sel d'or. Cela permet de régler précisément leur taille, et donc leurs propriétés, ce qui est crucial pour la plupart des applications. Les microréacteurs en continu, dans lesquels le mélange de la solution de sel avec celle contenant l'agent réducteur est optimal, permettent un contrôle accru de la réaction, et donc de la taille des NPs. Malgré tout, même dans cas, la synthèse de NPs de très petite taille nécessite d'utiliser des agents réducteurs très puissants qui sont souvent nocifs pour l'Homme et pour l'Environnement. Nous proposons de limiter leur impact et de développer un procédé de fabrication plus parcimonieux en insérant dans le micro-réacteur une cellule d'électrolyse afin de synthétiser in-situ la juste quantité d'agent réducteur nécessaire à la réaction.
Votre mission consistera à tester et adapter une (ou des) cellule(s) d'électrolyse en continu pour la synthèse de NPs d'or. Pour cela, vous devrez identifier différents systèmes réactionnels et types de cellules adaptés. Vous pourrez également tester différents agents de surface qui permettent de stabiliser ces NPs tout en leur conférant des propriétés chimiques intéressantes sur le plan biologique. Tout au long de ce travail, vous veillerez à maintenir les bonnes caractéristiques des NPs (taille, propriétés chimiques de surface, propriétés optiques, etc.) en fonction de l'application visée.
Approche multi-échelle pour la propagation des ultrasons en milieux multi-diffusifs inhomogènes
Les ondes ultrasonores sont fortement influencées par la microstructure des matériaux, ce qui entraîne atténuation, dispersion, et bruit. La modélisation de ces effets est essentielle, notamment pour le contrôle non destructif, où ils peuvent soit gêner la détection de défauts, soit fournir des informations sur le matériau. Des modèles analytiques et numériques permettent de mieux prédire et interpréter ces phénomènes. Des propriétés statistiques homogènes sont généralement supposées. En pratique, les microstructures présentent souvent des variations spatiales importantes, liées par exemple aux procédés de fabrication. Selon l’échelle de ces variations par rapport à la longueur d’onde, elles peuvent induire des changements abrupts ou progressifs de propriétés effectives. Cette thèse vise à établir un cadre théorique intégrant à la fois l’aléa microstructural et ses variations spatiales, afin de proposer des stratégies de simulation pertinentes selon les échelles considérées. L’approche sera d’abord développée en 1D, puis étendue aux cas 2D et 3D en s’appuyant sur des outils développés au laboratoire, avec des validations numériques et éventuellement expérimentales.
Coordination de la flexibilité des convertisseurs d’électronique de puissance raccordés réseau de distribution en vue de participation à la stabilité du système électrique global.
Avec l’augmentation des productions et consommations connectées via des convertisseurs d’électronique de puissance, le réseau électrique évolue vers une structure plus dynamique et décentralisée. Cette transformation accroît le besoin et l’intérêt de leur participation active à la flexibilité et à la stabilité du système, notamment pour compenser les variations de production des énergies renouvelables et assurer un bon équilibre entre l’offre et la demande. La coordination optimisée du contrôle de ces dispositifs présente un fort potentiel pour améliorer la résilience du réseau, en exploitant intelligemment leurs capacités de régulation de tension, de fréquence et de puissance réactive. Toutefois, pour intégrer efficacement ces contributions à grande échelle, il est crucial de développer des approches de modélisation holistique permettant de capturer les interactions multi-échelles, tant spatiales que temporelles. Les travaux de modélisation dans cette thèse visent à représenter le lien entre la flexibilité de réponse en puissance active/réactive des convertisseurs d’électronique de puissance et la marge de stabilité apporté au réseau et aussi l’agrégation de leurs actions en vue d’une contribution au système intégré. Suite à cette étape, des architectures et des algorithmes de contrôle coordonnées entre le réseau de distribution et le réseau de transport seront étudiés, développés et validés.
Prédiction des effets de dispersion d’ondes élastiques par un modèle semi-analytique sous approximation hautes fréquences
Les méthodes d’inspection ultrasonores (UT) sont une composante essentielle des contrôles non-destructifs (CND). Elles sont couramment employées pour l’inspection de composants mécaniques tels que les soudures (nucléaire, pétrochimie) ou les structures en matériau composite (aéronautique). Afin de comprendre les phénomènes physiques en jeu pour une configuration donnée, la simulation est un atout et parfois une étape incontournable pour la mise en place du procédé d’inspection. Les approches de modélisation se répartissent en deux grandes familles : les modèles purement numériques, basés sur les éléments finis (EF), et les méthodes semi-analytiques, dérivées d’approximations haute fréquence (HF) comme les rayons paraxiaux. Ces dernières, bien que privilégiées pour leur efficacité calculatoire, introduisent des simplifications pouvant altérer la précision quantitative des résultats, en particulier pour des phénomènes comme la dispersion (variation de la vitesse des ondes selon la fréquence), fréquents dans certains contextes industriels.
Ce projet de thèse vise à enrichir l’approche par rayons paraxiaux en y intégrant des modèles d’interfaces dispersives (interplis composites, couches de couplant), des milieux viscoélastiques dispersifs, ainsi qu’un modèle d’ondes guidées modales. L’ambition est de concevoir un outil de simulation capable de reproduire fidèlement des configurations de contrôle réalistes, améliorant ainsi la représentativité des résultats.
Concilier la prédictabilité et la performance dans les architectures de processeurs pour les systèmes critiques
Les systèmes critiques possèdent à la fois des exigences fonctionnelles et temporelles, ces dernières garantissant que toutes les échéances sont respectées pendant l’exécution ; tout dépassement pourrait entraîner des conséquences catastrophiques. La nature critique de ces systèmes impose la mise en œuvre de solutions matérielles et logicielles spécialisées.
Cette thèse de doctorat porte sur le développement d’architectures matérielles pour systèmes critiques, appelées architectures prédictibles, capables de fournir les garanties temporelles nécessaires. Plusieurs architectures de ce type existent déjà, généralement fondées sur des pipelines in-order et intégrant soit des restrictions comportementales (par exemple, la désactivation de mécanismes de spéculation complexes), soit des spécialisations structurelles (par exemple, des caches re-designés ou une arbitrage déterministe pour l’accès aux ressources partagées). Ces restrictions et spécialisations ont inévitablement un impact sur les performances ; la conception d’architectures prédictibles doit donc traiter directement le compromis entre prédictibilité et performance. Cette thèse vise à explorer ce compromis d’une manière nouvelle, en adaptant une variante hautes performances d’un processeur in-order (CVA6) et en développant des techniques top-down pour le rendre prédictible. Les performances de tels processeurs reposent habituellement sur des mécanismes tels que la prédiction de branchement, le préchargement (prefetching) et la prédiction de valeurs, mis en œuvre à l’aide d’éléments de stockage spécialisés (par exemple, des tampons) et appuyés par des mécanismes de contrôle tels que la restauration d’état (rollback) en cas de mauvaise spéculation. Dans ce contexte, l’objectif de la thèse est de définir un schéma général de prédictibilité pour l’exécution spéculative, couvrant à la fois l’organisation du stockage et le comportement de restauration.
Détection hors distribution avec des modèles de fondation de vision et des méthodes post-hoc
Le sujet de thèse se concentre sur l'amélioration de la fiabilité des modèles de deep learning, en particulier dans la détection des échantillons hors distribution (OoD), qui sont des points de données différents des données d'entraînement et peuvent entraîner des prédictions incorrectes. Cela est particulièrement important dans des domaines critiques comme la santé et les véhicules autonomes, où les erreurs peuvent avoir des conséquences graves. La recherche exploite les modèles de base de la vision (VFMs) comme CLIP et DINO, qui ont révolutionné la vision par ordinateur en permettant l'apprentissage à partir de données limitées. Le travail proposé vise à développer des méthodes qui maintiennent la robustesse de ces modèles pendant le fine-tuning, garantissant qu'ils peuvent toujours détecter efficacement les échantillons OoD. En outre, la thèse explorera des solutions pour gérer les changements de distribution des données au fil du temps, un défi courant dans les applications du monde réel. Les résultats attendus incluent de nouvelles techniques pour la détection OoD et des méthodes adaptatives pour les environnements dynamiques, améliorant ainsi la sécurité et la fiabilité des systèmes d'IA dans des scénarios pratiques.
Evaluation de l'impact du procédé d'extrusion en voie sèche sur la microstructure et les performances de cathodes pour batteries tout-solide à électrolytes polymères
Les batteries à électrolyte solide (solid-state batteries, SSB) ont pour objectif de dépasser la technologie lithium-ion actuelle en termes de densité d’énergie et de sécurité, avec des applications dans les véhicules électriques ou le stockage d’énergie stationnaire. La fabrication de ces nouvelles technologies de batteries peut soit s’appuyer sur les infrastructures existantes (mélange et enduction d’encres d’électrodes à base de solvant), soit nécessiter de nouveaux procédés de fabrication. Dans ce contexte, le procédé d’extrusion bi-vis présente plusieurs avantages lorsqu’il est appliqué aux SSB, en particulier avec des électrolytes à base de polymères.
Afin d’accélérer le déploiement des SSB à base de polymères, une meilleure compréhension du procédé d’extrusion appliqué à la fabrication des électrodes positives est nécessaire. L’objectif de cette thèse est de développer de nouvelles formulations d’électrodes par extrusion en voie fondue et de comprendre l’impact des paramètres du procédé sur les performances finales. Elle permettra de fournir au final une vision claire des avantages et limitations de l’extrusion par rapport au procédé classique d’enduction.
Ce projet de doctorat s’inscrit dans une collaboration entre le CEA et Stellantis pour le développement de nouvelles batteries tout-solide. L’étude portera sur le développement d’électrodes composites élaborées par extrusion, destinées à être utilisées dans des SSB à base de polymères. Dans un premier temps, les matériaux seront sélectionnés et caractérisés afin d’effectuer une première sélection de formulations à l’aide d’une extrudeuse à l’échelle laboratoire. Ensuite, une évaluation systématique de l’impact des matériaux d’entrée et des conditions opératoires du procédé d’extrusion sera réalisée afin de mettre en évidence les relations entre le procédé, les microstructures des électrodes et leurs performances. Enfin, les formulations d’électrodes les plus performantes seront intégrées dans un prototype entièrement fabriqué par extrusion et caractérisées par des tests électriques et des analyses post-mortem.
Le doctorant bénéficiera de l’environnement multidisciplinaire du CEA-LITEN (campus de Grenoble) ainsi que du savoir-faire industriel de Stellantis. La Plateforme de Prototypage de Batteries sera utilisée pour les essais d’extrusion et l’assemblage des cellules, tandis que l’accès à des équipements de caractérisation avancée (MEB-EDX, XPS, rhéomètres, méthodes électrochimiques, etc.) permettra d’acquérir une compréhension approfondie des mécanismes mis en jeu dans le procédé d’extrusion.
Étude de l’intensification du transfert de chaleur par ébullition convective dans les micro canaux appliquée au refroidissement des unités de calcul dans les data centers
La thèse proposée vise à mieux comprendre et modéliser, pour de nouveaux fluides réfrigérants à faible impact environnemental, les phénomènes d’ébullition convective en micro canaux.
Le doctorant adoptera une approche combinant expérimentation et modélisation multi-échelle, incluant la conception d’un banc d’essai simulant le comportement d’un micro évaporateur, la réalisation de simulations CFD (ANSYS Fluent, CATHARE) pour décrire les régimes diphasiques, et l’évaluation de différents fluides alternatifs écologiques à faible impact environnemental. Les résultats attendus portent, pour chacun de ces nouveaux fluides, sur la caractérisation des mécanismes d’ébullition confinée, le développement d’un modèle prédictif du transfert de chaleur, et la proposition de solutions de refroidissement innovantes.
En effet, les besoins croissants en calcul intensif, portés par l’intelligence artificielle et le cloud, entraînent une augmentation significative de la puissance dissipée dans les processeurs des puces électroniques. Les technologies de refroidissement monophasique actuelles atteignent leurs limites face à des flux thermiques dépassant 100 W/cm². Le refroidissement diphasique, basé sur l’ébullition d’un fluide pour évacuer la chaleur, est capable d’assurer des transferts de chaleur beaucoup plus efficaces que le refroidissement monophasique, tout en réduisant la consommation énergétique globale. Les résultats de la thèse contribueront à atteindre des solutions plus performantes et durables pour les futurs data centers. Ce travail contribuera à réduire l’empreinte énergétique du numérique et à renforcer la souveraineté technologique européenne dans le domaine des technologies de refroidissement avancées.