ParisDataEng' #16 ~ Data Engineering and Privacy


Details
Salut à tous,
Pour ce nouveau Meetup, nous sommes accueillis par Stuart.
Nous parlerons Privacy By Design avec Spark, gouvernance de données et industrialisation.
Comme d'habitude, on va garder du temps pour discuter entre nous de "DataLake" et du quotidien d'ingénieur de la donnée !
A très vite !
L'équipe Paris Data Eng'
⚠ Pensez à vous munir de votre carte d’identité, elle peut vous être demandée à l’entrée.
===========================
Agenda
18h30 - Accueil des participants
19h00 - High performance Privacy By Design using Matryoshka and Spark par Olivier Girardot [Français]
The protection of a user's personal information is a fundamental right,
That job will be done by data engineers team, right? They should protect a billion of data structures. It sounds tedious! How can we do that providing a high performance, with a maintainable, testable and clean code using functional programming approach, and in a reasonable time?
Don’t worry, Matryoshka makes it possible to browse your data structures using recursion schemas approach, what if we use it directly in Spark columns to make it more performant? It’s possible because we did it!
Join us we will inspire you and reveal how we did it.
19h45 - Que peut apporter la gouvernance des données pour les Data Engineers ? par Julien Buret [Français]
En 30 minutes, Julien Buret - CTO et co-fondateur de Zeenea - expliquera l’importance et les enjeux d’une gouvernance des données pour une entreprise et notamment les équipes les exploitant. Il présentera également les solutions implémentées dans Zeenea pour y répondre.
20h - Gérer les données en temps réel chez Stuart ou comment déployer un service de ML en production par Andy Barakat [Français]
Comment déployer un service de Machine Learning en production ? Comment consommer, transformer et mettre à disposition un grand volume de donnée en temps réel ? Nous vous partagerons les challenges auxquels nous avons été confrontés lors de l’implémentation d’un micro-service clé chez Stuart.
20h30 - Data Cocktail et Networking
Merci à notre hôte Stuart (https://stuart.com/fr/) de nous accueillir et nous offrir boissons et nourriture.
===========================
Présentation des speakers
Olivier Girardot
Olivier Girardot is a software engineer and co-founder of Lateral Thoughts. He works on machine learning, big data, and DevOps solutions with clients to help them tackle problems that require both expertise and experience, in order to become more efficient both as a company and as a team.
Julien Buret
Julien Buret est CTO chez Zeenea. Il a précédemment exercé le poste de CTO et d'architecte Bigdata chez Xebia où il a entre autres mis en place de nombreux data lakes et architectures data pour ses différents clients.
Andy Barakat
Diplômé de l’Ecole Centrale Paris, et d’un master spécialisé en Business Analytics à l’Imperial College London, Andy a rejoint Stuart en janvier 2017 dans l’équipe Data, à Paris puis à Londres. Depuis plus d’un an, il occupe le poste de Senior Data Engineer dans l’équipe parisienne. Il travaille sur des problématiques de traitement de données en temps réel, ainsi qu’à la construction et maintenance de la Data Warehouse chez Stuart. Il est aussi formateur sur des sujets de Data Engineering et Data Analytics en collaboration avec la plateforme OnTrain.

ParisDataEng' #16 ~ Data Engineering and Privacy