DataLake, MapReduce & Spark, Véhicules Connectés


Details
Bonjour à tous,
C’est au campus de l’IESEG, au cœur de la Grande Arche de La Défense que nous allons nous retrouver le Jeudi 4 Juin dès 18h00 pour le prochain Hadoop User Group. Au programme, modélisation du Data Lake, étude de cas Mappy sur le traitement de logs avec MapReduce et Spark et présentation du projet « véhicules connectés » de PSA Peugeot Citroën ! 3 sujets autour d'Hadoop comme on les aime !
Talk 1. Les « Data Warehouse » et « Data Mart », leur modélisation en étoiles ou en flocons sont des concepts maîtrisés depuis longtemps. Ils sont la fondation des systèmes de Business Intelligence d'aujourd’hui. L’apparition d’Hadoop, sa capacité à stocker des données non structurée sont à l’origine des « Data Lake », réservoir où l’on stocke toutes les données de l’entreprise … avec la promesse d’en déduire de nouvelles opportunités de business. Peut-on appliquer, ou doit-on appliquer les mêmes concepts de modélisation avec Hadoop ? Ne faut-il pas tout remettre en cause ? Cyrille Coqueret , Directeur Technique Business Intelligence & Big Data de la société EDIS Consulting détaillera les bonnes pratiques à mettre en œuvre pour modéliser un « Data Lake »
Talk 2. Mappy, le service de cartographie et d'informations géolocalisées sur web et mobile qui permet de se déplacer facilement jusque dans nos commerces, tout le monde connait ! La société s’est lancée dans l’aventure Hadoop il y a deux ans pour gérer des centaines de giga de « logs » provenant de centaines de serveurs, contrôler leurs performances, leurs usages mais aussi identifier les nouveaux « points d’intérêt » des utilisateurs web. Florent Voignier, Architecte Big Data chez Databig et Nicolas Korchia, responsable Business Intelligence chez Mappy nous raconteront l’aventure technique par laquelle ils sont passés, de Hadoop 1 à Hadoop 2, Map Reduce vs Spark et les évaluations des différents outils SQL comme HBase/Phoenix, Impala et Tableau.
Talk 3. L’internet des objets est là. L’Airbus A350, équipé de 6.000 capteurs, génère 2,5 TB d’information par vol. Ces données sont ensuite analysées pour, entre autres, optimiser la consommation des moteurs. Plus proche de nous, la voiture de monsieur tout le monde sera bientôt connectée et dialoguera avec son environnement. Chez PSA Peugeot Citroën, autre fleuron industriel, on travaille sur les véhicules connectés dans l’optique d’améliorer sécurité, confort, maintenance préventive, gestion du trafic. On pensait que les Big Data étaient Big, nous n’avons certainement encore rien vu ! Michael Thiriet, Architecte Technique BI et Big Data chez PSA nous fera découvrir ce fabuleux projet.
Remarque: pour des raisons de sécurité, la liste des participants sera communiquée 24h avant l’événement à la Grande Arche. Merci d’indiquer un nom, prénom et une adresse email professionnelle valide lors de votre inscription meetup. Merci à ceux possédant déjà une fiche meetup de vérifier la cohérence des informations saisies. Inscriptions possibles jusqu'au 3 Juin, 17h.
Merci à la société EDIS Consulting, sponsor de l’événement et à l’IESEG School of Management de nous accueillir
http://photos2.meetupstatic.com/photos/event/6/d/7/2/600_437608018.jpeg

DataLake, MapReduce & Spark, Véhicules Connectés