Les plateformes en ligne permettent une large diffusion de l'information, mais leurs modèles économiques centrés sur l'engagement des utilisateurs favorisent souvent la diffusion de contenus politiques idéologiquement homogènes ou controversés. Ces modèles peuvent conduire à la polarisation des opinions politiques et entraver le bon fonctionnement des systèmes démocratiques. Cette thèse étudiera des modèles génératifs d'IA innovants conçus pour comprendre en profondeur la polarisation politique et pour contrer ses effets. Elle mobilisera plusieurs sous-domaines de l'intelligence artificielle : l'apprentissage génératif, l'IA frugale, l'apprentissage continu et l'apprentissage multimédia. Les avancées seront associées aux défis suivants :
-la modélisation de la polarisation politique et l’utilisation du modèle obtenu pour guider les algorithmes d'IA mis en oeuvre ;
-la collecte et le nettoyage de données politiques multimodales massives et diversifiées pour assurer une couverture thématique et temporelle, et la création d’un espace de représentation sémantique commun ;
-la proposition de modèles génératifs orientés politique afin d'encoder les connaissances du domaine de manière efficace et efficiente et de générer des données d'entraînement pour les tâches aval ;
-la spécialisation des modèles pour les tâches spécifiques nécessaires à une compréhension fine de la polarisation (détection de thèmes, reconnaissance d’entités, analyse de sentiments) ;
-la mise à jour continue des modèles génératifs et des tâches spécifiques à la polarisation pour suivre la dynamique des événements et des nouvelles politiques.