Exploitation avancée des données de santé par de l'apprentissage collaboratif sécurisé

Depuis quelques années, l’apprentissage profond est utilisé avec succès dans de nombreux domaines et est de plus en plus intégré dans la recherche clinique et le domaine de la santé. La capacité à combiner des sources de données diverses, telles que la génomique et l’imagerie, améliore la prise de décision médicale. L’accès à de grands jeux de données hétérogènes est essentiel pour améliorer la qualité et la précision des modèles. L’apprentissage fédéré est actuellement développé pour répondre à cette exigence, en offrant la possibilité d’entraîner des modèles de manière décentralisée garantissant que les données brutes restent stockées localement du côté client (entité qui génère les données sensibles). Plusieurs frameworks open-source intègrent des protocoles de calcul sécurisé pour l’apprentissage fédéré, mais leur applicabilité au domaine de la santé demeure limitée et soulève des enjeux liés à la souveraineté des données.
Dans ce contexte, un framework français, actuellement développé par le CEA-LIST, introduit une architecture d’apprentissage fédéré edge-to-cloud intégrant un chiffrement de bout en bout, avec notamment le chiffrement homomorphe (Fully Homomorphic Encryption), et une résilience face aux attaques malveillantes. Grâce à ce framework, ce projet vise à fournir des composants modulaires et sécurisés pour l’apprentissage fédéré afin de favoriser l’innovation en IA appliquée au domaine de la santé et notamment à la génomique.

Ce projet se focalisera sur trois axes principaux :
1) Déploiement, surveillance et optimisation de modèles d’apprentissage profond au sein de solutions d’apprentissage fédéré et décentralisé.
2) Intégration de grands modèles dans l’apprentissage collaboratif.
3) Développement de méthodes d’agrégation pour des situations non IID (Independant and Identically Distributed).

Développement d’anticorps monoclonaux pour le diagnostic et le traitement des infections à Klebsiella pneumoniae hypervirulentes

Nous observons depuis quelques années l’émergence de souches de Klebsiella pneumoniae hyper-virulentes (hvKp) devenues très résistantes aux antibioques. Dans un contexte de raréfaction des options antibiotiques, les anticorps (Ac) monoclonaux dirigés contre des antigènes capsulaires bien conservés de ses souches d’HvKp apparaissent comme une alternative thérapeutique prometteuse.
Ce projet de thèse s’articule autour de trois objectifs complémentaires :
1. Décrire la circulation des clones de hvKp par analyse génomique comparative des souches collectées via le Centre National de Référence de la Résistance aux Antibiotiques et via une collaboration internationale.
2. Produire et caractériser des Ac monoclonaux dirigés contre la capsule de HvKp.
3. Développer un outil de détection rapide basé sur l’analyse des profils MALDI-TOF couplée à des algorithmes de machine learning.

Origines et évolution des protéines de type prion (PrLP) chez les eucaryotes

Initialement associées aux maladies neurodégénératives, les protéines de type prion (PrLP) sont aujourd’hui reconnues comme des acteurs physiologiques majeurs de la plasticité cellulaire et de la réponse au stress. Ces protéines possèdent souvent un domaine intrinsèquement désordonné riche en glutamine et asparagine, dit prion-like domain (PrLD), capable de basculer entre états solubles, condensés ou amyloïdes. Des exemples emblématiques incluent CPEB chez l’Aplysie, impliquée dans la mémoire synaptique, MAVS dans la réponse antivirale, MED15 et FUS dans la régulation transcriptionnelle et la dynamique des condensats nucléocytoplasmiques, ou encore ELF3 chez les plantes, dont la polymérisation amyloïde contrôle la floraison et la photopériode. Chez les champignons, les protéines Sup35, Ure2p et HET-s constituent des modèles expérimentaux de prions fonctionnels, montrant que l’agrégation réversible peut servir de mécanisme de régulation ou d’adaptation. Ces transitions conformationnelles sont désormais perçues comme des réponses adaptatives, et non comme des dérives pathologiques. Cette thèse vise à retracer l’origine et la diversification des protéines de type prion à l’échelle des eucaryotes, en testant l’hypothèse selon laquelle les grandes crises paléoclimatiques ont favorisé l’apparition et la duplication de gènes codant des domaines PrLD via l’expansion de microsatellites et l’activité des éléments transposables. Le projet combinera analyses phylogénomiques, détection de domaines PrLD et modélisation des pressions de sélection, afin de cartographier les grandes étapes de l’évolution fonctionnelle des PrLP et leur lien avec la tolérance au stress.

Effets combinés de l’hypoxie et de la mécanique matricielle sur la physiopathologie de la fibrose pulmonaire

La fibrose pulmonaire idiopathique (FPI) est une maladie chronique, incurable et mortelle, caractérisée par une altération de la barrière alvéolo-capillaire, un dépôt excessif de matrice extracellulaire (MEC), une hypoxie locale et une rigidité accrue du tissu pulmonaire. Ces modifications perturbent les interactions cellulaires et favorisent la transition vers un état pro-fibrosant. Ce projet de thèse vise à comprendre comment l’environnement mécanique (rigidité tissulaire) et chimique (hypoxie) influence le comportement des cellules pulmonaires (plasticité, phénotype) et leurs communications intercellulaires (paracrines et juxtacrines), en conditions in vitro contrôlées. Pour cela, des supports biomimétiques à rigidité variable seront développés, adaptés à la co-culture des principaux types cellulaires de la barrière alvéolo-capillaire. L’étude portera sur la réponse cellulaire à la rigidité et à l’hypoxie, l’analyse du sécrétome, du protéome et l’impact de la communication cellulaire. L’objectif est d’identifier des facteurs pro-fibrosants mécano- et chimio-dépendants, afin de mieux comprendre les mécanismes de progression de la FPI et de proposer de nouvelles cibles thérapeutiques et approches régénératives.

PtSeipin: un pont entre biogenèse et dégradation des gouttelettes lipidiques chez la diatomée Phaeodactylum tricornutum

Les microalgues regroupent une grande diversité d’organismes et suscitent un intérêt croissant en raison de leur capacité à produire des biomolécules d’intérêt industriel et biotechnologique. En particulier, elles peuvent accumuler de l’huile sous forme de gouttelettes lipidiques (LD, lipid droplets) en réponse à des stress abiotiques tels que la carence en azote. Cette accumulation d’huile représente un fort potentiel pour la production de biocarburants.
Nous avons récemment montré que l’inactivation du gène codant la Seipine, une protéine impliquée dans la biogenèse des LD, entraîne une forte accumulation d’huile chez la diatomée Phaeodactylum tricornutum. De plus, cette accumulation semble liée à une absence de dégradation des LD dans les mutants dépourvus de Seipine. Ces résultats suggèrent que, chez cette diatomée, les LD sont programmées pour être dégradées dès leur formation et que l’inhibition de la dégradation pourrait être une stratégie intéressante pour augmenter la production d’huile. Le présent projet vise à élucider les mécanismes de dégradation des LD et, plus particulièrement, les liens entre leur biogenèse et leur dégradation, ce qui permettra d'identifierde nouvelles cibles d'intérêt. Trois axes principaux seront développés :
1. Identifier les partenaires de PtSeipine impliqués dans la dégradation des LD, en combinant une approche ciblée (protéines candidates) et une approche globale (sans a priori).
2. Déterminer les mécanismes de dégradation des LD altérés dans les mutants PtSeipin KO, en combinant des observations en microscopie électronique avec des analyses transcriptomiques et protéomiques.
3. Comprendre l’utilisation que les microalgues font de l’huile lors de la phase de sortie de stress, à l’aide d’approches de fluxomique.

Régulation de l’expression des gènes par l’acétylation et la lactylation des protéines histones

Dans les cellules eucaryotes, l’ADN s’enroule autour de protéines histones pour former la chromatine. La modification dynamique des histones par diverses structures chimiques permet de réguler finement l’expression des gènes. Des altérations dans ces mécanismes complexes de régulation sont à l’origine de nombreuses maladies. L’acétylation des lysines d’histones est connue pour induire l’expression des gènes. D’autres structures peuvent être ajoutées sur les histones, dont les effets sur la transcription restent largement à élucider. La plupart d’entre elles, comme la lactylation découverte en 2019, dépendent du métabolisme cellulaire. Nous étudions cette nouvelle modification dans la spermatogenèse murine : ce processus de différentiation cellulaire constitue en effet un modèle de choix pour étudier la régulation de la transcription, du fait de changements spectaculaires dans la composition de la chromatine et dans le programme d’expression génique. Nous avons établi la distribution sur le génome de marques acétylées et lactylées sur trois lysines de l’histone H3. L’objet de cette thèse est de contribuer au déchiffrage du « langage histone », d’abord en étudiant le rôle des lactylations sur le programme transcriptionnel. Ensuite, la prédiction d'états chromatiniens sera raffinée en intégrant nos nouvelles données à de nombreuses données épigénomiques disponibles, au sein de modèles de réseaux de neurones.

Top