Thèse Modèles Échangeables Profonds H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Clermont Auvergne École doctorale : Sciences Fondamentales Laboratoire de recherche : Laboratoire de Mathématiques Blaise Pascal Direction de la thèse : Pierre LATOUCHE ORCID 0009000973981640 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-25T23:59:59 Les données de réseau, qui représentent les entités sous forme de noeuds et leurs interactions sous forme de liens, sont fondamentales pour comprendre la structure et la dynamique des systèmes interconnectés. Ces données sont essentielles tant pour les avancées théoriques que pour les applications pratiques, car elles offrent un cadre permettant d'étudier les relations et les dépendances que les formats de données indépendants traditionnels ne peuvent pas capturer. L'importance des données de type réseau réside dans leur capacité à encoder des interactions complexes, à révéler des comportements émergents et à fournir des informations sur les processus qui opèrent sur des structures relationnelles. L'apprentissage profond a récemment révolutionné l'analyse des réseaux en fournissant des outils puissants pour modéliser des relations non linéaires et complexes dans les données structurées en graphes.
Au coeur de l'apprentissage profond pour les réseaux se trouvent les GNN qui généralisent les réseaux de neurones aux données de graphes. Ces modèles propagent et agrègent l'information à travers les noeuds et les liens, permettant ainsi l'apprentissage de représentations. Bien que les avancées récentes en statistiques et en apprentissage profond pour l'analyse des réseaux aient ouvert de nouvelles possibilités pour comprendre les systèmes complexes, offrant des performances de pointe dans une gamme de tâches, l'analyse des réseaux complexes doit désormais faire face à des défis liés à la scalabilité, à l'hétérogénéité et à l'interprétabilité.
Le modèle échangeable, également appelé modèle de graphon ou modèle W-graphe, est largement considéré comme l'un des modèles aléatoires de graphes les plus fondamentaux pour l'analyse des réseaux. Comme décrit dans Lovász et Szegedy (2006), il constitue le modèle limite pour caractériser toute matrice d'adjacence représentant un graphe lorsque le nombre de noeuds augmente. Il peut également être intégré dans une classe générale de modèles de graphes aléatoires inhomogènes (Bollobás et al., 2007). Sa définition repose uniquement sur l'hypothèse d'échangeabilité des lignes et des colonnes de la matrice d'adjacence, comme démontré par Diaconis et al. (2008) à l'aide du théorème d'Aldous-Hoover, qui est une extension du théorème de de Finetti aux tableaux. Étant donné un réseau, l'estimation de la fonction graphon d'un tel modèle est une tâche particulièrement difficile, de sorte que les approches existantes sont principalement non paramétriques et présentent de mauvaises propriétés de passage à l'échelle, ne permettant d'analyser que des réseaux de petite taille.
Ce projet est motivé par deux observations clés. Premièrement, le modèle échangeable est un modèle universel, qui généralise la plupart des modèles de graphes aléatoires existants. Il est donc crucial de l'utiliser à des fins de modélisation, pour rechercher des motifs hétérogènes et complexes dans les réseaux. Deuxièmement, la plupart des approches d'apprentissage automatique pour les réseaux ont utilisé l'apprentissage profond uniquement pour l'inférence, tout en considérant des modèles simples et limités pour caractériser les données. Quelles que soient les améliorations proposées, comme l'utilisation de mécanismes d'attention ou de transformers, ces techniques sont limitées par la nature des modèles considérés. Nous proposons donc de considérer une nouvelle classe de modèles, désignés sous le nom de modèles échangeables profonds, où les réseaux de neurones profonds sont utilisés dans le modèle lui-même pour caractériser les données, et non uniquement pour l'inférence. Au coeur de ce projet se trouve la volonté d'utiliser des réseaux de neurones, qui sont des approximateurs universels de fonctions (Hornik et al., 1989 ; Cybenko, 1989), pour caractériser les fonctions graphon des modèles échangeables, qui forment une classe universelle de modèles de graphes aléatoires pour les réseaux.
Les données de réseau, qui représentent les entités sous forme de noeuds et leurs interactions sous forme de liens, sont fondamentales pour comprendre la structure et la dynamique des systèmes interconnectés. Ces données sont essentielles tant pour les avancées théoriques que pour les applications pratiques, car elles offrent un cadre permettant d'étudier les relations et les dépendances que les formats de données indépendants traditionnels ne peuvent pas capturer. L'importance des données de type réseau réside dans leur capacité à encoder des interactions complexes, à révéler des comportements émergents et à fournir des informations sur les processus qui opèrent sur des structures relationnelles. L'apprentissage profond a récemment révolutionné l'analyse des réseaux en fournissant des outils puissants pour modéliser des relations non linéaires et complexes dans les données structurées en graphes.
Le profil recherché
Le ou la candidat·e doit être titulaire ou en cours d'obtention d'un master 2 en statistiques ou en apprentissage automatique (machine learning). Il ou elle doit également posséder un bagage mathématique particulièrement solide.