Plongements lexicaux : modèles, temporalité, biais, interprétabilité

Détails

Bonjour à tous,

Pour ce premier meetupML de 2020, nous accueillerons Nicolas Dugué, enseignant chercheur à l'université de Le Mans qui nous parlera de traitement du langage et plus particulièrement de ces modèles de plongements lexicaux (ou word embeddings) et des questions sous-jacentes de recherche qui émergent de l'utilisation de ces modèles.
Un résumé de son intervention est détaillé ci-dessous.

INRIA Bretagne nous accueillera dans ses locaux pour ce meetupML qui, comme d'habitude, débutera à 19h et se terminera avec un petit pot.

Résumé:
Après avoir décrit l'intuition des modèles de plongements lexicaux et leur formalisme, nous nous emploierons à discuter des questions de recherche qui émergent pour leur exploitation. Ainsi nous évoquerons le cadre de l'évolution de la langue et de la détection de néologismes via les modèles temporels. Nous aborderons également les biais des représentations apprises en utilisant ces modèles : les corpus exploités pour l'apprentissage sont des productions humaines, les plongements en sont le reflet et ils encapsulent donc les stéréotypes existants dans ces corpus. En particulier, nous considèrerons le biais de genre, bien étudié dans la littérature. Enfin, nous concluerons cet exposé en discutant des approches existantes pour favoriser l'interprétabilité de ces représentations denses, approches basées paradoxalement sur la sparsification de ces représentations.

Mots-clefs:
Word embeddings models, time-based generalization, gender bias, interpretability

Biographie:
Durant sa thèse, Nicolas Dugué a étudié via des méthodes statistiques, de théorie des graphes et d’apprentissage automatique des questions de recherche comme la mesure de la visibilité et de l’influence d’un utilisateur sur un réseau social, la détection du spam ou encore la détection d’évènements sur ces mêmes réseaux. Cela l’a amené à s’intéresser à des problèmes d’apprentissage supervisé, de détection de communauté dans des graphes, ou de rôle dans des réseaux. Aujourd'hui, au LIUM, il travaille avec les équipes EIAH et LST sur des projets variés autour de la fouille de données : fouille de corpus textuels, caractérisation de profils d’apprenants, détection d’opinion, détection du rôle social d’un individu dans un réseau, etc.

Au plaisir de vous voir nombreux,
Camille & Hugues