Hadoop Meetup avec Cloudera et Synaltic (HUG)

Name: Hadoop Meetup avec Cloudera et Synaltic (HUG)
Start: 2017-03-15T19:00:00+01:00
End: 2017-03-15T21:30:00+01:00
Location: Mille Mercis

Hosted by Carbone C.

Modern Data Stack France

Details

Bonjour à tous,

Nous avons le plaisir de vous inviter au Hadoop User Group le mercredi 15 mars 2017 chez Mille Mercis (28 Rue de Châteaudun, 75009, Paris).

Les inscriptions pour ce meetup seront ouvertes à partir de lundi 6 mars 2017 9h30.

Les présentations débuteront à 19h suivies d'une 3e mi-temps qui nous permettra de continuer les discussions dans la bonne humeur.

Un agenda intéressant vous attend pour ce meetup:

• 18h30-19h00 : Accueil des participants, planning de la soirée

• 19h00-19h45 : Enveloppe par Nihed Mbarek, Solutions Architect chez Cloudera

Envelope est une application Apache Spark Streaming qui peut être configuré pour implémenter facilement les Streaming Data Pipelines dans un cluster CDH.

Les cas d'utilisation cible pour Envelope sont les pipelines qui doivent déplacer, et peut-être transformer (en utilisant SQL) les données d'une file d'attente (comme Apache Kafka) à une couche de stockage (comme Apache Kudu). L'objectif d'Envelope est de réduire la quantité de code de plomberie nécessaire au développement de ces pipelines - parfois même sans nécessiter de coder, juste en configurant.

• 19h45-20h30 : Data engineer's toolkit par Horacio LASSEY-ASSIAKOLEY, Consultant chez Synaltic

Avoir des données de qualité, mise à jour à la bonne fréquence et correctement présentées permet de prendre les bonnes décisions. Mais de nos jours, il y a de plus en plus de cloisons entre les différentes données au sein d’une entreprise pour différentes raisons. De ce fait, la donnée est en constant mouvement au sein du système d’information d’une entreprise. Un des rôles du data engineer est de s’assurer que les utilisateurs ne sentent pas ou très peu ce cloisonnement. Quand on est en charge de construire ces voies d’échange de données, on doit faire un choix entre les différentes options suivantes :

• Coder les flux d’intégration à la main ou avec un framework

• Utiliser un ETL

• Mettre en place une architecture orientée bus avec un ESB

• Utiliser les frameworks de data processing orientés Big Data (Spark, Kafka streams, etc).

Cette présentation se focalisera sur les différents outils et approches d’échange de données. Il présentera chaque outil dans son contexte historique et ces différents cas d’utilisation.La loi du "qui peut le plus, peut le moins" ne marche pas très bien dans tous les cas. Il est essentiel de faire le bon choix afin d'éviter d'avoir l’impression de tuer une mouche avec une bombe ou d’aller à la guerre avec un pistolet à eau.

• 20h30-.. : Apéro networking

Merci de vous enregistrer afin que l’on puisse s’assurer du bon déroulement logistique.

Un grand merci à Mille Mercis (http://www.millemercismariage.com) pour nous prêter leur salle et à Cloudera (http://www.cloudera.com) pour s'occuper de l'apéritif dinatoire.

L'équipe HUG France

http://hugfrance.fr

@hugfrance (https://twitter.com/hugfrance)

Modern Data Stack France

Hadoop Meetup avec Cloudera et Synaltic (HUG)

Modern Data Stack France

Details

Related topics

You may also like