ParisDataEng' #12 ~ Stream Data Processing

Criteo

32 Rue Blanche · Paris

How to find us

METRO ligne 2 Station Blanche METRO ligne 12 Station Trinite - d'Estienne d'Orves METRO ligne 13 Station Liège

Location image of event venue

Details

Salut à tous,

Pour ce nouveau Meetup, nous sommes accueillis par Criteo et nous parlerons essentiellement de Data Processing, de Stream Data Processing plus précisément.

Comme d'habitude, nous garderons du temps pour discuter entre nous de "datalake" et du quotidien d'ingénieur de la donnée !

A très vite !

⚠ Pensez à vous munir de votre carte d’identité, elle peut vous être demandée à l’entrée.

Détails
=======================

▶ Le 20 juin 2019
🕛 De 18h30 à 22h00
📍 32 Rue Blanche, 75009 Paris
💬 La session sera animée par Sara et Brahim

Agenda
=======================

18h30 - Accueil des participants

19h00 - Deploying a Change Data Capture stack with Kafka, Kafka Connect and Debezium par Clément Demonchy [Français]

REX How Jobteaser got rid of an old data dump job using change data capture (cdc) with Debezium and Kafka.

19h30 - Apache Kafka : Patterns / Anti-patterns par Damien Gasparina [Français]

Lorsque qu'Apache Kafka est utilisé dans des applications critiques, un déploiement stable et fiable est nécessaire dès le début.
Au cours de cet échange, nous évoquerons les erreurs les plus communes rencontrées sur le terrain et comment les éviter.
Comment assurer la durabilité des messages ? Quels sont les paramètres de configuration à connaître ? Et, avant tout, comment monitorer Apache Kafka ? Nous tenterons de répondre à ces différentes questions.

20h15 - Learn What Criteo is doing with Apache Kafka and Presto par Hervé Rivière et Raphaël Claude [Français]

Criteo runs one of the largest Apache Kafka deployments in the world, streaming ~500B events across it each day. Presto is the new kid on the block and shows huge promise in accelating warehouse-scale analytics and ETL. In this talk engineers from Criteo's SRE Data Processing group will discuss both of these systems and how Criteo is leveraging then in its day to day operations.

20h40 - Introduction à Apache Pulsar par Bruno Bonnin [Français]

"Apache Pulsar, encore un système de messages pub/sub", me direz-vous ? C'est pas faux... Néanmoins, regardons de plus près... Pulsar est devenu un Top Level Project de la fondation Apache au mois de septembre 2018 et il se targue de vouloir unifier les modèles de messages traditionnels et le streaming, tout en fournissant un système extrêmement performant. Alors partons à la découverte de ce nouveau pulsar pour voir de quoi il retourne !

21h00 - Data Cocktail et Networking

Merci à notre hôte Criteo (https://www.criteo.com) de nous accueillir et nous offrir boissons et nourriture.

Présentation des speakers
===========================

Clément Demonchy

Clément Demonchy is a data engineer since 2015, currently working at JobTeaser a french based company helping student to find their dream job, you can find some of his article on their tech blog. His main stack is python, AWS, Kubernetes with some experience on Kafka and Airflow.

Damien Gasparina

Ingénieur passionné d'open-source, Damien a passé la plupart de son temps a travaille dans le monde de la base de données pour des éditeurs de logiciel comme MongoDB.
Fraîchement revenue en France après avoir passé plusieurs années en Angleterre, Damien a rejoint Confluent, la société fondée par les créateurs d'Apache Kafka.
En tant que Solution Architect, il travaille en étroite collaboration avec des clients de toutes tailles et de toutes formes - allant de petites startups aux banques mondiales - sur divers sujets tels que la conception de systèmes, l'intégration de données ou la manipulation de données en temps réel.

Bruno Bonnin

Vieux développeur ayant un fort penchant pour les langages de vieux (Java), de jeunes vieux (JavaScript) et de jamais jeunes (Python), pour le NoSQL (MongoDB, Elasticsearch) et le Big Data (Hadoop).

Hervé Rivière

DevOps à Criteo, membre du département SRE (Site Reliability Engineering) son équipe assure la scalabilité, stabilité et performance de l'infrastructure streaming de Criteo. Hervé est aussi un des organisateurs du Paris Kafka Meetup.