Support logiciel pour calcul clairsemé

Les performances des calculateurs sont devenues limitées par les déplacements des données dans les domaines de l'IA, du HPC comme dans l'embarqué. Il existe pourtant des accélérateurs matériels qui permettent de traiter des mouvements de données de façon efficace énergétiquement, mais il n'existe pas de langage de programmation qui permette de les mettre en œuvre dans le code supportant les calculs.

C'est au programmeur de configurer explicitement les DMA et utiliser des appels de fonctions pour les transferts de données et analyser les programmes pour en identifier les goulots d'étranglement mémoire.

Par ailleurs les compilateurs ont été conçus dans les années 80, époque à laquelle les mémoires travaillaient à la même fréquence que les cœurs de calcul.

L'objet de cette thèse sera d'intégrer dans un compilateur la possibilité de réaliser des optimisations basées sur les transferts de données.

Contrats HW/SW pour l’analyse de robustesse aux fautes de processeurs open-source

Cette thèse se concentre sur la cybersécurité des systèmes embarqués, en particulier sur la vulnérabilité des processeurs et des programmes face aux attaques par injection de fautes. Ces attaques perturbent le fonctionnement normal des systèmes, permettant aux attaquants d'exploiter des failles pour accéder à des informations sensibles. Bien que des méthodes formelles aient été développées pour analyser la robustesse des systèmes, elles se limitent souvent à des analyses séparées du matériel et des logiciels, négligeant l'interaction entre les deux.

Le travail proposé vise à formaliser des contrats entre le matériel et le logiciel (HW/SW) spécifiquement pour l'analyse de sécurité contre les injections de fautes. En s'appuyant sur une approche de partitionnement matériel, cette recherche cherche à atténuer les problèmes de scalabilité liés à la complexité des modèles de microarchitecture. Les résultats attendus incluent le développement de techniques et d'outils permettant une vérification efficace de la sécurité des systèmes embarqués, ainsi que la création de contrats qui faciliteront l'évaluation de la conformité des implémentations matérielles et logicielles. Cette approche pourrait également réduire le temps de mise sur le marché des systèmes sécurisés.

Sécurisation cryptographique d’enclaves de processeurs RISC-V avec CHERI

CHERI (Capability Hardware Enhanced RISC Instructions) est une solution permettant de sécuriser le processeur contre les fuites spatiales et temporelles de mémoire en transformant tout pointeur en capacité définissant de façon claire les bornes d’accès aux données ou instructions adressées.
Dans cette thèse, nous proposons sur un processeur d’applications RISC-V d’enrichir CHERI et ses possibilités d’intégrité de flot de contrôle avec une protection des instructions allant jusqu’à leur exécution contre tout type de modifications. Dans un second temps, sur la base d’un chiffrement authentifié de la mémoire, nous étudierons la possibilité avec CHERI de définir des enclaves sécurisées permettant une isolation cryptographique entre processus. Le processeur sera modifié pour que chaque processus soit chiffré avec sa propre clé et puisse avoir un cycle de vie sûr. L’ensemble des clés devra être protégé efficacement dans le matériel.

Contact : olivier.savry@cea.fr

Combinaison de sous et surapproximations de la memoire pour l'analyse de code bas-niveau

Le théorème de Rice énonçant qu'on ne peut pas avoir de méthode qui sache automatiquement dire si une propriété sur un programme est vraie ou non a conduit à séparer les outils de vérification en deux groupes: les outils sound fonctionnant par sur-approximation, comme l'interprétation abstraite, sont capables de prouver automatiquement que certaines propriétés sont vraies, mais ne savent parfois pas conclure et produisent des alarmes; à l'inverse, les outils complete fonctionnant par sous-approximation, comme l'exécution symbolique, savent produire des contre-exemples, mais pas démontrer si une propriété est vraie.

*Le but général de la thèse est d'étudier la combinaison entre méthodes sound et complete d'analyse de programme, et en particulier l'analyse statique par interprétation abstraite et la génération de formules sous-approximée par exécution symbolique*.

Nous nous intéresserons particulièrement à la combinaison d'abstractions sur et sous-approximantes, en particulier pour la mémoire. Les applications envisagées en priorité concernent les analyses de code au niveau binaire, telles que réalisées par la combinaison des plateformes d'analyse BINSEC et CODEX, pour pouvoir trouver des failles de securite automatiquement ou demontrer leur absence.

Résolutions de problèmes inverses par deep learning appliqués à l'interférométrie

Dans la continuité des travaux de thèse de Benoît Rougier et de Jérémi Mapas appliqués à l'interférométrie radiofréquence sur la compréhension de la propagation d’une onde électromagnétique à travers une onde de choc pour l'étude à cœur des propriétés de matériaux innovants, cette thèse vise à exploiter les signaux bruts du radio interféromètre pour déterminer simultanément la vitesse d’un choc et la vitesse matérielle dans des solides inertes ou énergétiques soumis à un choc soutenu ou non-soutenu. Un modèle de propagation des ondes millimétriques dans un milieu dissipatif présentant deux couches diélectriques séparées par des interfaces en mouvement a été élaboré pour adresser le cas du choc soutenu. Une résolution du problème inverse du modèle à deux couches avec pertes a été proposée avec l'apport du deep learning et des réseaux convolutifs. Un modèle multicouche sans pertes diélectriques a été également initié pour le cas du choc non soutenu.

L’exploitation des signaux bruts de l’interférométrie laser pour la mesure de vitesse d’interface fait également l’objet de nombreux travaux en traitement du signal avec par exemple l’utilisation de la transformée de Fourrier glissante, et/ou de la méthode des ondelettes. L’application du deep learning à l’interférométrie laser est recherchée pour permettre d’améliorer l’analyse des résultats. La synergie entre les deux approches métrologiques est un atout pour améliorer l’architecture des réseaux de neurone, notamment avec des méthodes d’apprentissage basées sur la modélisation des signaux bruts.
Références :
Reflection of Electromagnetic Waves on Moving Dielectric Interfaces for Analyzing Shock Phenomenon in Solids, B. Rougier, H. Aubert, A. Lefrancois, Y. Barbarin, J. Luc, A. Osmont, RadioScience, 2018

Plus particulièrement, l’objectif consistera à approfondir la compréhension et la modélisation des phénomènes de transmission et de réflexion d’une onde électromagnétique se propageant dans un matériau soumis à un choc, à améliorer le travail d’inversion du modèle de propagation à partir de réseaux de neurones afin de pouvoir extraire de manière plus précise la vitesse de choc, la vitesse matérielle et l’indice de réfraction choqué du signal rétrodiffusé dans le matériau et enfin de concevoir des campagnes expérimentales afin d’acquérir des données nous permettant de valider les différents modèles développés.

Implémentation d’algorithmes parallèles sur GPU pour les simulations du combustible nucléaire sur supercalculateurs exaflopiques

Dans un contexte où le calcul haute performance (HPC) est en perpétuelle évolution, le design des nouveaux supercalculateurs tend à intégrer toujours plus d’accélérateurs ou de cartes graphiques (GPUs), qui fournissent l’essentiel de la puissance de calcul de la plupart des supercalculateurs actuels. En raison de leurs différences architecturales par rapport aux unités centrales de calcul (CPUs) et des environnements logiciels en constante évolution, les GPUs posent de profonds défis de programmation. Une utilisation efficace de leur puissance de calcul demande une refonte des algorithmes et logiciels de simulation existants pour atteindre un parallélisme massif.

Le CEA a développé la plateforme de calcul PLEIADES dédiée à la simulation du comportement des combustibles, depuis la fabrication jusqu’au comportement en réacteur, puis lors du stockage. Elle inclut une parallélisation en mémoire distribuée MPI permettant une parallélisation sur plusieurs centaines de cœurs. Cette plateforme répond aux exigences des partenaires du CEA que sont EDF et Framatome, mais il est nécessaire de l’adapter pour les nouvelles infrastructures de calcul. Proposer une solution flexible, portable et performante pour les simulations sur des supercalculateurs équipés de GPUs est d'un intérêt majeur afin de capturer des physiques toujours plus complexes sur des simulations comportant des domaines de calcul toujours plus grands.

Dans ce cadre, la thèse visera d’élaborer puis évaluer différentes stratégies de portage de noyaux de calculs sur GPU ainsi que l’utilisation de méthodes de répartition dynamique de la charge adaptés aux supercalculateurs GPUs actuels et futurs. Le candidat s’appuiera sur des outils développés au CEA comme les solveurs thermo-mécaniques MFEM-MGIS [1,2] ou MANTA [3]. Les solutions logicielles et algorithmes parallèles proposés avec cette thèse permettront à terme la réalisation de grands calculs de modélisation multi-physique en 3D du comportement des crayons combustibles sur des supercalculateurs comportant des milliers de cœurs de calcul et des GPUs.

Le candidat travaillera au sein du Laboratoire de développement des Outils de Calcul Scientifique (OCS) combustibles PLEIADES (LDOP) au département d'études des combustibles (DEC - Institut IRESNE, CEA Cadarache). Il sera amené à évoluer dans une équipe pluridisciplinaire composée de mathématiciens, physiciens, mécaniciens et informaticiens. A terme, les contributions de la thèse visent à enrichir la plate-forme numérique pour la simulation de combustibles nucléaires PLEIADES.

Références : [1] MFEM-MGIS - https://thelfer.github.io/mfem-mgis/; [2] Th. Helfer, G. Latu. « MFEM-MGIS-MFRONT, a HPC mini-application targeting nonlinear thermo-mechanical simulations of nuclear fuels at mesoscale ». IAEA Technical Meeting on the Development and Application of Open-Source Modelling and Simulation Tools for Nuclear Reactors, June 2022, https://conferences.iaea.org/event/247/contributions/20551/attachments/10969/16119/Abstract_Latu.docx, https://conferences.iaea.org/event/247/contributions/20551/attachments/10969/19938/Latu_G_ONCORE.pdf; [3] O. Jamond et al. «MANTA : un code HPC généraliste pour la simulation de problèmes complexes en mécanique », https://hal.science/hal-03688160

Cas d'Assurance Dynamiques pour les Systèmes Autonomes Adaptatifs

Donner l'assurance que les systèmes autonomes fonctionneront de manière sûre et sécurisée est une condition préalable à leur déploiement dans des domaines d'application critiques en termes de mission et de sécurité. Généralement, les assurances sont fournies sous la forme de cas d'assurance, qui sont des arguments vérifiables et raisonnés démontrant qu'une revendication de haut niveau (concernant généralement la sécurité ou d'autres propriétés critiques) est satisfaite compte tenu d'un ensemble de preuves relatives au contexte, à la conception et à la mise en œuvre d'un système. L'élaboration de cas d'assurance est traditionnellement une activité analytique, réalisée hors ligne avant le déploiement du système, et sa validité repose sur des hypothèses/prédictions concernant le comportement du système (y compris ses interactions avec son environnement). Cependant, il a été avancé que cette approche n'est pas viable pour les systèmes autonomes qui apprennent et s'adaptent en cours de fonctionnement. Cette thèse abordera les limites des approches d'assurance existantes en proposant une nouvelle catégorie de techniques d'assurance de la sécurité fondées sur la sécurité qui évaluent et font évoluer en permanence le raisonnement de sécurité, en même temps que le système, afin de fournir une assurance de la sécurité tout au long de son cycle de vie. En d'autres termes, l'assurance de la sécurité sera fournie non seulement au cours du développement et du déploiement initiaux, mais aussi en cours d'exécution, sur la base de données opérationnelles.

Génération assistée de noyaux de calculs complexes en mécanique du solide

Les lois de comportement utilisées dans les simulations numériques décrivent les caractéristiques physiques des matériaux simulés. À mesure que notre compréhension de ces matériaux évolue, la complexité de ces lois augmente.L'intégration de ces lois constitue une étape critique pour la performance et la robustesse des calculs scientifiques. De ce fait, cette étape peut conduire à des développements intrusifs et complexes dans le code.

De nombreuses plateformes numériques telles que FEniCS, FireDrake, FreeFEM, Comsol, proposent des techniques de génération de code à la volée (JIT, pour Just In Time) pour gérer différentes physiques. Cette approche JIT réduit considérablement les temps de mise en oeuvre de nouvelles simulations, offrant ainsi une grande versatilité à l'utilisateur. De plus, elle permet une optimisation spécifique aux cas traités et facilite le portage sur diverses architectures (CPU ou GPU). Enfin, cette approche permet de masquer les détails d'implémentation: une évolution de ces derniers est invisible pour l'utilisateur et est absorbée par la couche de génération de code.

Cependant, ces techniques sont généralement limitées aux étapes d'assemblage des systèmes linéaires à résoudre et n'incluent pas l'étape cruciale d'intégration des lois de comportement.

S'inspirant de l'expérience réussie du projet open-source mgis.fenics [1], cette thèse vise à développer une solution de génération de code à la volée dédiée au code de mécanique des structures de nouvelle génération Manta [2] développé par le CEA. L'objectif est de permettre un couplage fort avec les lois de comportement générées par MFront [3], améliorant ainsi la flexibilité, les performances et la robustesse des simulations numériques.

Le doctorant bénéficiera d'un encadrement de la part des développeurs des codes MFront et Manta (CEA), ainsi que des développeurs du code A-Set (collaboration entre Mines-Paris Tech, Onera, et Safran). Cette collaboration au sein d'une équipe multidisciplinaire offrira un environnement stimulant et enrichissant pour le candidat.

De plus, le travail de thèse sera valorisé par la possibilité de participer à des conférences et de publier des articles dans des revues scientifiques à comité de lecture, offrant une visibilité nationale et internationale aux résultats de la thèse.

Le doctorat se déroulera au CEA Cadarache, dans le sud est de la France, au sein du département d'études des combustibles nucléaires de l'institut IRESNE [4]. Le laboratoire d'accueil est le LMPC dont le rôle est de contribuer au développement des composants physiques de la plateforme numérique PLEIADES [5], co-développée par le CEA et EDF.

[1] https://thelfer.github.io/mgis/web/mgis_fenics.html
[2] MANTA : un code HPC généraliste pour la simulation de problèmes complexes en mécanique. https://hal.science/hal-03688160
[3] https://thelfer.github.io/tfel/web/index.html
[4] https://www.cea.fr/energies/iresne/Pages/Accueil.aspx
[5] PLEIADES: A numerical framework dedicated to the multiphysics and multiscale nuclear fuel behavior simulation https://www.sciencedirect.com/science/article/pii/S0306454924002408

CORTEX: Orchestration de Conteneurs pour les applications Temps-Réel, Embarqués/edge, à criticité miXte

Cette proposition de thèse de doctorat vise à développer un schéma d'orchestration de conteneurs pour les applications en temps réel, déployées sur un continuum de ressources de calcul hétérogènes dans l'espace embarqué-edge-cloud, avec un focus particulier sur les applications nécessitant des garanties en temps réel.

Les applications, allant des véhicules autonomes, à la surveillance de l'environnement ou à l'automatisation industrielle, exigent traditionnellement une grande prédictibilité avec des garanties en temps réel, mais elles demandent de plus en plus de flexibilité à l'exécution ainsi qu'une minimisation de leur empreinte environnementale globale.

Pour ces applications, une stratégie adaptative innovante est nécessaire pour optimiser dynamiquement (à l'exécution) le déploiement des charges logicielles sur les nœuds matériels, avec un objectif mixte-critique combinant des garanties en temps réel et la minimisation de l'empreinte environnementale.

Révolutionner l'intervention en milieux complexes : L'IA et les Jumeaux numériques en synergie pour des solutions innovantes et efficaces.

Contexte scientifique
L’exploitation d’équipements complexes, notamment dans le secteur nucléaire, repose sur l’accès rapide et sécurisé à des données hétérogènes. Les avancées en IA générative, combinées aux Jumeaux Numériques (JN), offrent des solutions innovantes pour améliorer les interactions humain-système. Cependant, l’intégration de ces technologies dans des environnements critiques nécessite des approches adaptées pour garantir intuitivité, sécurité et efficacité.
Travail proposé
Cette thèse propose de développer une architecture d’IA générative enrichie par des données métiers et accessible via la réalité mixte, permettant à un opérateur de boite à gants de poser des questions en langage naturel. Les travaux incluent :
1. Une revue de l’état de l’art sur la génération augmentée (RAG), les technologies ASR/TTS et les JN.
2. Le développement et l’intégration d’un chatbot pour l’exploitation nucléaire.
3. L’évaluation des interactions humain-IA et la définition de métriques d’efficacité et d’adoption.
Résultats attendus
Le projet vise à améliorer la sécurité et la productivité grâce à une interaction optimisée et à proposer des guidelines pour l’adoption de ces systèmes dans des environnements critiques.

Top