Qui sommes-nous ?
Espace utilisateur
Formation continue
Credit : L. Godart/CEA
D’un jour à plusieurs semaines, nos formations permettent une montée en compétence dans votre emploi ou accompagnent vers le retour à l’emploi. 
Conseil et accompagnement
Crédit : vgajic
Fort de plus de 60 ans d’expériences, l’INSTN accompagne les entreprises et organismes à différents stades de leurs projets de développement du capital humain.
Thèses
Accueil   /   Thèses   /   Apprentissage fédéré sur des données verticalement partitionnées provenant de participants hétérogènes

Apprentissage fédéré sur des données verticalement partitionnées provenant de participants hétérogènes

Data intelligence dont Intelligence Artificielle Défis technologiques Informatique et logiciels Sciences pour l’ingénieur

Résumé du sujet

L'apprentissage fédéré permet à plusieurs participants d'entraîner en collaboration un modèle global, sans partager leurs données, mais seuls les paramètres du modèle sont échangés entre les participants et le serveur. Dans l'apprentissage fédéré vertical (VFL), les données des participants partagent des échantillons similaires, mais ont des attributs différents. Par exemple, des entreprises de différents domaines possédant des données avec des attributs différents collaborent pour résoudre une tâche d'apprentissage automatique. Bien que les données soient privées, VFL reste vulnérable aux attaques telles que les attaques de type Feature/Label Inference Attack. Différentes méthodes de protection (par exemple, la confidentialité différentielle, le chiffrement homomorphe) ont été étudiées pour protéger la confidentialité du VFL. Le choix des méthodes appropriées est un défi car il dépend de l'architecture de VLF et du niveau de confidentialité souhaité (par exemple, modèles locaux, résultats intermédiaires, modèles appris). La variabilité du système de chaque participant peut également entraîner une latence élevée et des mises à jour asynchrones, ce qui affecte la performance du modèle et l'efficacité de l’entraînement.

L'objectif de cette thèse est de proposer des méthodes pour effectuer VFL de manière confidentielle, en tenant compte de l'hétérogénéité des participants. Premièrement, le candidat étudiera les architectures des modèles VFL et les mesures de confidentialité afin de proposer des protocoles d’entraînement sécurisés et confidentiels pour VFL. Deuxièmement, le candidat étudiera les impacts de l'hétérogénéité du système des participants, tels que les ressources de calcul et de communication, afin de concevoir des solutions pour rendre les protocoles proposés robustes à ce type d’hétérogénéité. Troisièmement, les compromis entre la performance, la confidentialité et l’efficacité du VFL seront étudiés afin de proposer un cadre pratique permettant de piloter les protocoles en fonction des caractéristiques d'un problème d'apprentissage automatique donné.

Laboratoire

Département d’Instrumentation Numérique
Service Monitoring, Contrôle et Diagnostic
Laboratoire Instrumentation Intelligente, Distribuée et Embarquée
Top envelopegraduation-hatlicensebookuserusersmap-markercalendar-fullbubblecrossmenuarrow-down