Outils et modèles statistiques pour l'allocation dynamique
Détails
Lorsqu'un utilisateur (par exemple un médecin) doit réaliser un choix entre une ancienne et une nouvelle solution (par exemple un vaccin), il faut déterminer le plus vite possible si le nouveau produit doit être adopté ou l'ancien maintenu. Toute erreur se traduirait en pertes (comme par exemple des pertes humaines). Cette problématique peut également se retrouver dans de nombreux secteurs, comme par exemple la publicité en ligne (où l'utilisateur doit mettre en place deux publicités différentes) ou la finance.
Cependant, il est nécessaire de collecter suffisamment de données pour trouver la meilleure solution (explorer) avant de pouvoir la mettre en production (c'est-à-dire exploiter).
Les algorithmes de bandits ont été introduits pour répondre à ce genre de problématique : à quel moment dois-je stopper mon exploration pour démarrer mon exploitation?
Autrement dit : comment trouver la meilleure solution tout en minimisant les pertes?
Emmanuelle Claeys est doctorante à l'Universite de Strasbourg. http://www.emmanuelle-claeys.com/
Programme de la soirée:
18:30 Accueil
18:40 Presentation par Emmanuelle Claeys
19:10 Discussions