Machine Learning : de la vision de la Si Valley à la réalité du data scientist
Détails
Résumé
Pour le néophyte, l'apprentissage par machine est auréolé d'une image mystérieuse et attrayante. On parle d'intelligence artificielle, d'ordinateurs plus malins que les meilleurs joueurs d'échec ou de Go, de singularité, ....Dans la vraie vie, pour le data scientist, Machine Learning rime plutôt avec nettoyage des données, filtrage, modélisation, traitement d'image, régression linéaire, classification, ...
Dans ce meetup, nous verrons justement ce qu'il en est sur un cas concret, dans le domaine des énergies renouvelables. Nous détaillerons pas à pas la démarche de la mise en place d'un apprentissage par machine, et nous verrons que la machine n'apprend finalement pas grand chose :)
Bio
Guillaume Saupin a obtenu sa thèse de doctorat au CEA en 2008, en partenariat avec l'INRIA et l'université de Lille. Pendant presque 10 ans, il a travaillé comme chercheur au sein du CEA dans le domaine de la mécanique non régulière et la réalité virtuelle. L'essentiel de son activité portait sur la mise au point de simulateurs mécaniques, mais aussi sur le lancer de rayon pour la dosimétrie ou encore la simulation de foule. Un attention toute particulière était portée sur l'obtention de très bons temps de calcul en soignant les algos, les accès mémoires et en parallélisant sur CPU ou GPU. Depuis 2015, il est responsable de la R&D chez QosEnergy, et travaille sur des problématiques de Big Data et de Machine Learning dans le domaine des énergies renouvelables. C'est aussi un grand fan du Lisp ;)
Lecture
Niveau biblio :
- http://statweb.stanford.edu/~tibs/ElemStatLearn/ (http://statweb.stanford.edu/%7Etibs/ElemStatLearn/)
- http://www-bcf.usc.edu/~gareth/ISL/ (http://www-bcf.usc.edu/%7Egareth/ISL/)
Toute présentation par Guillaume mérite de la lecture du lisp :
