ParisDataEng' #13 ~ Machine Learning Engineering

Cet événement est passé

101 y sont allés

Xebia - Consulting firm IT

156 Boulevard Haussmann · Paris

Comment nous trouver

METRO ligne 9, 13 Station Miromesnil. Proche de la Gare Paris Saint-Lazare.

Image du lieu de l'événement

Détails

Salut à tous,

Pour ce nouveau Meetup, nous sommes accueillis par Xebia-Publicis Sapient.

Le Machine Learning Engineering est l'ensemble des processus qui permettent la mise en production de Machine Learning grâce à l’optimisation d’algorithmes. Cette session a pour but d'en présenter les contours et de mettre en avant l'émergence d'outils permettant d'aider les ML Engineers/Data Engineers au quotidien.

Comme d'habitude, on va garder du temps pour discuter entre nous de "DataLake" et du quotidien d'ingénieur de la donnée !

A très vite !

L'équipe Paris Data Eng'

⚠ Pensez à vous munir de votre carte d’identité, elle peut vous être demandée à l’entrée.

===========================
Agenda
===========================

18h30 - Accueil des participants

19h00 - Utilisation de MLflow pour le cycle de vie des projet Machine learning par Arduino Cascella [Français]

Mlflow est un projet opensource pour administrer le cycle de vie des projets machine learning (de l’expérimentation jusqu’au déploiement) afin de mieux les intégrer dans l’écosystème qui les entoure.
Durant cette présentation nous montrerons les différentes composantes de MLflow et ferons une démonstration de son utilisation à la fois dans le contexte d’une plateforme Databricks et d’un IDE local.

19h45 - ONNX : déploiement de modèles de Machine Learning par Xavier Dupré [Français]

Le langage Python est le plus utilisé pour construire des modèles de machine learning mais il n'est pas le plus efficace pour prédire à partir de ces modèles. ONNX est une solution qui ne dépend pas de Python, qui est disponible sur Windows, Linux, CPU, GPU, ARM. Il s'applique au deep learning et au machine learning. La présentation présente les concepts et quelques exemples.

20h - Romain Sagean [Français]

Lors du DataxDay je vous ai appris à industrialiser les prédictions d'un réseau de neurones à l'aide de DL4J et Spark. Maintenant les Data Scientists voudraient tester différentes variantes de réseaux de neurones. Pendant ce temps, votre modèle en production donne des prédictions. Il faudra suivre son évolution pour vérifier que ses performances ne se dégradent pas.

20h30 - Data Cocktail et Networking

Merci à notre hôte Xebia Publicis Sapient (https://www.xebia.fr) de nous accueillir et nous offrir boissons et nourriture.

===========================
Présentation des speakers
===========================

Xavier Dupré

Graduated in 1999 from the ENSAE and doctor in 2004, Xavier Dupré began his career at A2iA, a company specialized in automatic reading of cheques and handwriting recognition. After a short passage in finance, he joined Yahoo in 2008 to work on search query rewriting problems by implementing statistical algorithms designed for all languages. In 2010, Xavier joined Microsoft to participate in the local search engine. He contributed to the partnership between PagesJaunes and Bing. Xavier continues to work on very large scale problems for Microsoft’s search engine and contributes to Microsoft open sources projects (ML.net, onnxmltools). Meanwhile, Xavier Dupré have been teaching programming since 2001 at the ENSAE. The courses have expanded in 2014 to machine learning and technologies associated to big data. More recently, Xavier started to leverage student’s work about machine learning through hackathons and academical projects with non-profitable organizations.

Arduino Cascella

Arduino Cascella est Solutions Architect chez Databricks, où il aide les clients à extraire la valeur de leurs données en adressant les défis posés par le Big Data. Avant de rejoindre Databricks, Arduino a eu un parcours très varié, allant du Machine Learning et la détection de fraudes au NoSQL, en passant aussi par la sécurité informatique.

Romain Sagean

Développeur depuis 4 ans, Romain « scauglog » s’intéresse à tout ce qui tourne autour de l’écosystème Big Data. UX de formation, il aime rapprocher ces deux mondes et code secrètement en JavaScript.